로마--(뉴스와이어)--인공지능 기반 언어 솔루션 분야를 선도하는 Translated는 생성형 인공지능과 콘텐츠 제작 분야의 중대한 이정표가 될 혁신적 언어 모델 T-LM(Translated Language Model)을 선보인다. T-LM는 OpenAI가 제공하는 GPT-4의 잠재력을 전 세계 기업이 온전히 활용할 수 있도록 길을 열어준다. 콘텐츠를 200개 언어로 생성하고 재구성할 수 있는 솔루션을 가성비 높은 가격으로 제공해서 기업이 GPT-4를 영어로 사용할 때와 그 외 언어로 사용할 때 겪어야 했던 성능 격차를 줄여주는 것이다.
지금까지 GPT의 뛰어난 성능은 영어를 사용하는 지역에서만 누릴 수 있는 특권이었다. 비영어권 기업에서는 GPT를 사용하더라도 몇 년 전 모델보다 성능이 뒤처지는 경우가 많고 언어에 따라서는 그 격차가 3년까지 벌어지기도 한다. 이러한 기업들은 콘텐츠를 이해, 생성, 재구성하는 성능 차이를 지속적으로 경험하다 보니 생성형 인공지능의 모든 장점을 제대로 활용하지 못하는 경우가 태반이다. 게다가 비영어로 GPT-4를 사용하면 운영 비용도 15배까지 높아진다(첨부 도표 참조). Translated의 T-LM 서비스는 다양한 수상 경력으로 우수성이 입증된 적응형 기계 번역 기술에 OpenAI의 GPT-4를 결합하여 전 세계 인구의 95%가 사용하는 언어로 모든 기업이 첨단 생성형 인공지능을 활용할 수 있게 만든다.
Translated의 마르코 트롬베티(Marco Trombetti) CEO는 이 프로젝트에 대해 다음과 같이 평가한다. “생성형 인공지능에서 영어가 우세함에 따라 영어권 기업이 불공정한 경쟁우위를 차지하는 상황이 초래되고 있습니다. Translated는 T-LM을 통해 혁신적인 기술을 누구나 접할 수 있게 만들어서 전 세계 비영어권 기업이 효율성을 높이고 경쟁력을 유지할 수 있도록 돕습니다.”
이렇게 영어와 비영어의 성능이 벌어지는 이유는 학습에 동원되는 자료 대부분이 영어로 되어있기 때문이다. ‘커먼 크롤(Common Crawl)’ 데이터세트와 위키피디아가 그 대표적인 예이다. 그래서 영어가 아닌 언어로 GPT-4를 사용하면 결과의 완성도가 현저히 떨어진다. T-LM은 이런 격차를 해소하기 위해 영어 외 언어로 입력된 명령어를 영어로 번역한 후 사용자의 언어로 다시 번역하는 특수 모델을 사용한다. 이렇게 하면 영어에 최적화된 텍스트 분할(토큰화) 기반으로 가격이 책정되므로 영어 외 언어로 GPT-4를 사용할 때 드는 비용을 절감하는 효과까지 얻을 수 있다.
T-LM 활용 범위는 글로벌 콘텐츠 작성 팀의 콘텐츠 작성 보조, 다국어 고객 지원 강화, 세계 여러 나라의 플랫폼에서 공개할 사용자 생성 콘텐츠 제작 지원 등으로 다양하다.
T-LM은 현재 API를 통해 이용할 수 있으며 자세한 사항은 https://translatedlabs.com/gpt 에서 확인할 수 있다.
Translated는 T-LM를 통해 모두가 자신의 언어로 이해하고 이해받는 세상을 만든다는 사명을 다시 한번 강조하고, 이 사명을 완수하는 과정에서 OpenAI와 지속적으로 협력할 계획이다.
사진/멀티미디어 자료: https://www.businesswire.com/news/home/53407486/en