AI 성능 핵심은 ‘데이터 질’… 판티마, 맞춤형 고품질 데이터로 주목

[서울=제로투원미디어] 2025년 07월 30일 – 인공지능(AI) 기술 발전이 가속화되면서 AI 성능을 결정하는 핵심 요소로 ‘학습 데이터의 질’이 주목받고 있다. 단순한 데이터 축적을 넘어 실제 환경을 반영한 고정밀 데이터의 설계와 수집이 AI 경쟁력의 새로운 기준으로 자리잡고 있다.
이러한 패러다임 변화 속에서 AI 학습용 데이터 구축 전문기업 판티마(Pantima Inc)가 고품질 데이터 솔루션으로 업계의 주목을 받고 있다.
데이터 질이 AI 성능 좌우
업계 전문가들은 동일한 기술 기반으로 개발된 AI라도 체감 성능에서 차이가 발생하는 핵심 원인으로 ‘데이터의 질’을 지목한다. AI는 인간이 제공한 데이터를 기반으로 학습하며, 어떤 데이터를 어떻게 학습하느냐에 따라 최종 성능이 크게 달라진다는 분석이다.
실제로 국내외 주요 AI 기업들이 웹 크롤링이나 크라우드소싱으로 수집한 기존 데이터의 한계—비현실성, 불균형, 편향성 등—로 인해 서비스 품질 저하를 경험하고 있다. 이에 따라 산업 전반에서 맞춤형 데이터 수집, 정교한 검증 절차, 저작권 관리 등을 포함한 데이터 전략의 전면적 재검토가 이뤄지고 있다.
‘맥락 설계’ 통한 고품질 데이터 제공
판티마는 데이터 설계부터 수집, 정제, 납품까지 전 과정을 자체적으로 수행하며 실제 사용 환경을 반영한 고품질 데이터셋을 제공한다. 핵심은 ‘맥락 설계’다. 단순한 데이터 수집을 넘어 발화자의 성향, 대화 상황, 언어적 특징, 이미지 및 음성 구성 등 AI가 학습할 실제 환경을 정교하게 구현하는 것이다.
특히 ‘1사 1데이터 원칙’을 통해 동일한 데이터를 복수 기업에 제공하지 않으며, 수집된 데이터는 해당 고객사에만 독점 제공된다. 모든 프로젝트에는 검증된 참여자만 투입되고, 고객사 요구에 따라 신규 데이터를 수집해 저작권과 함께 납품한다. 납품 후에는 해당 데이터를 서버에서 완전히 삭제해 고객사의 독점적 활용을 보장한다.
글로벌 협업 확대
판티마는 현재 글로벌 AI 기업과 다국어 감성 음성 데이터를 활용한 협업을 논의 중이다. 이 데이터는 게임 및 챗봇 분야에서 감정 인식 정밀도를 높이는 데 활용될 예정이다.
또한 국내 주요 AI 기업에 다국어 필기체 이미지 데이터를 공급해 OCR(광학문자판독) 기술 고도화에 기여한 바 있다.
전신우 판티마 대표는 “AI가 현실을 더 잘 이해하기 위해서는 학습 데이터도 현실을 정확하게 반영해야 한다”며 “정확하게 설계된 고품질 데이터가 AI 시대의 경쟁력을 좌우한다”고 강조했다.
윤리적 데이터 수집과 정밀한 데이터 설계를 강점으로 내세운 판티마는 글로벌 시장 진출을 위한 전략적 투자 유치도 추진하고 있다.








