KorQuAD 1.0 리더보드 화면
서울--(뉴스와이어)--바이브컴퍼니(대표 이재용·김성언, 이하 바이브)의 인공지능(AI) 언어 모델이 한국어 기계 독해(Machine Reading Comprehension, MRC) 데이터셋인 ‘코쿼드(KorQuAD, Korean Question Answering Dataset) 1.0’ 기반 성능 평가에서 1위를 차지했다고 13일 밝혔다.
코쿼드 1.0은 2018년 12월 LG CNS가 공개한 위키백과 기반의 AI 학습용 한국어 표준 데이터 7만건을 포함한 한국어 질의응답 데이터셋이다. 미국 스탠퍼드대학에서 시작된 AI 언어지능 연구용 질의응답 데이터셋 ‘스쿼드(SQuAD, The Stanford Question Answering Dataset)'와 같은 방식으로 구현된다. 바이브는 이 테스트에서 EM[1] 스코어 88.28, F1[2] 스코어 95.79의 높은 점수를 기록하며 기술의 우수성을 입증했다.
바이브는 2000년 창립과 동시에 자연어 처리(NLP) 연구소를 설립하고, 그간 꾸준히 연구 개발 및 사업화를 진행해온 AI·빅데이터 전문 기업이다. 자사 기술의 우수성을 인정받아 2020년에는 기술 평가에서 AA 평가를 받으며 코스닥 시장에 입성했다.
대표 서비스로는 바이브의 데이터 분석 기법이 적용된 빅데이터 분석 서비스 ‘썸트렌드(Sometrend)’가 있으며, 최근에는 바이브의 AI·빅데이터 기술과 금융 분석 기술을 결합한 AI 기반 금융 정보 서비스 ‘핀터랩스(Finter Labs)’ 데모 버전을 개발하기도 했다. 이는 △종목 뉴스 △종목 발굴 △종목 분석 △섹터 분석 △테마 분석 △공시 분석 등 다양한 금융 정보를 제공하는 서비스로, 핀테크 자회사인 퀀팃과 공동 개발했다. 바이브의 기계 독해 기술은 자연어 질의에 대해 뉴스와 보고서에서 답을 찾아주는 자연어 QA와 중요 콘텐츠 선별 등에 활용되고 있다.
핀터랩스는 금융 전문 AI 어시스턴트인 ‘아이브(AIV)’도 서비스하고 있다. 자연어 대화를 통해 자료의 탐색과 분석, AI가 작성한 리포트까지 제공함으로써 주식에 대한 지식이 부족한 개인 투자자들도 쉽고 빠르게 투자 인사이트를 얻을 수 있도록 지원한다.
바이브 인공지능·빅데이터연구소 윤준태 부사장은 “꾸준히 AI 기술 연구를 고도화해 AI 어시스턴트뿐만 아니라 바이브의 다양한 사업과 접목할 계획”이라고 말했다.
[1] EM(Exact Match): 정답과 예측값이 얼마나 정확히 예측하는지에 대한 비율
[2] F1: 정밀도와 재현율을 종합적으로 고려한 수치