AI 데이터 품질관리 솔루션 전문 기업 페블러스는 자사 솔루션 '데이터 클리닉(Data Clinic)'의 핵심 알고리즘이 적용된 AI 데이터 품질 진단 및 개선 기술(US 12,481,720)이 미국 특허청(USPTO)에 정식 등록됐다고 28일 밝혔다.
이번 특허는 AI 데이터가 임베딩 공간에서 분포하고 밀집하는 양상을 분석해 품질 문제를 진단하고, 이를 개선하는 절차와 방법을 포괄한다. 비정형 데이터(텍스트·이미지 등)를 '데이터 지도(Image of Data)'로 시각화한 뒤, 고밀도·저밀도 영역을 분석하여 중복, 편향, 결손 데이터를 자동으로 식별하고 조정하는 것이 핵심이다. 이를 통해 대규모 AI 데이터셋에서 △중복 및 노이즈 제거(데이터 다이어트) △대표성 부족 영역 보강(데이터 벌크업) △개선된 데이터 지도 생성 등 품질 개선의 전 과정을 일관되게 구현할 수 있다.
페블러스는 이번 특허가 단순히 기술적인 측면을 넘어, 주력 제품인 '데이터 클리닉'의 핵심 아키텍처를 보호한다는 점에서 의의가 크다고 설명했다. 데이터 클리닉은 비정형 데이터를 자동 분석해 품질을 진단하고 개선책을 제시하는 AI 기반 서비스다. 이번 특허는 데이터 클리닉의 기본 원리인 '진단-분석-개선-검증' 프로세스를 기술적으로 뒷받침한다.
특히, 이번 기술은 AI 데이터 품질 국제표준 'ISO/IEC 5259'의 요구사항을 실질적으로 구현하는 기반을 제공한다. ISO/IEC 5259가 측정 대상과 기준을 규정한다면, 페블러스의 기술은 이를 측정하고 개선하는 구체적인 절차를 제시한다. 유사성, 대표성, 다양성 같은 추상적 품질 특성을 거리, 밀도, 매니폴드 구조 등 기하학적 속성으로 변환해 정량적으로 분석하는 방식이 특징이다.페블러스는 이번 미국 특허 등록을 계기로 데이터 클리닉의 기술적 독창성을 입증하고, AI 거버넌스 및 컴플라이언스 시장에서의 입지를 강화할 계획이다. EU AI 법(AI Act)과 ISO/IEC 42001 등 글로벌 규제가 강화되는 환경에서, 데이터 클리닉의 진단 결과는 기업이 AI 모델의 신뢰성과 책임성을 입증하는 핵심 감사 자료로 활용될 전망이다.