세계 최대 규모의 데이터 학습한 초거대 AI ‘EXAONE’ 공개

ⓒ 데일리포스트=이미지 제공/LG전자

[데일리포스트=김정은 기자] LG가 세계 최대 규모의 데이터를 학습 시킨 초거대 AI 'EXAONE(엑사원)'을 전격 공개하며 AI 생태계 확장에 나선다. 

LG AI연구원은 지난 5월부터 인간의 뇌에서 정보를 학습하고 기억하는 시냅스와 유사한 역할을 하는 인공 신경망의 파라미터를 13억개, 130억개, 390억개, 1750억개 등 단계적으로 키우며 초거대 AI를 연구해왔다.

'LG AI 토크 콘서트'에서 발표된 EXAONE은 'EXpert Ai for everyONE'의 축약어다. '인간을 위한 전문가 AI'를 의미한다. 'EX'는 '전문가'라는 뜻 외에 10의 18승 즉, 100경(京)을 뜻하는 접두어 'EXA'의 의미를 갖고 있다. 

EXAONE은 국내 최대인 약 3000억개의 파라미터를 보유하고 있으며, 언어뿐 아니라 이미지와 영상에 이르기까지 인간의 의사 소통과 관련된 다양한 정보를 습득하고 다룰 수 있는 멀티 모달리티(Multi-Modality) 능력을 갖췄다.

향후 멀티 모달 AI 기술이 고도화되면 AI가 데이터를 습득해 이해하는 수준을 넘어 추론하고, 시각과 청각 등 다양한 감각 영역을 넘나드는 창조적 생성을 할 수 있다.  

기존 AI는 텍스트를 분석해 이미지를 찾는 수준이었다면 EXAONE은 "호박 모양의 모자를 만들어 줘"라고 말하면 학습된 정보를 기반으로 스스로 판단해 '호박 모양의 모자' 이미지를 새롭게 만들어 낸다.

LG AI연구원은 이날 EXAONE이 제공할 수 있는 새로운 고객 경험에 대한 영상도 공개했다. 영상에는 메타버스 공간에서 크리스마스 파티를 준비하는 EXAONE이 고객이 말하는 의도를 파악해 의상을 직접 만들어 추천하고, 집안의 공간을 꾸미는 과정이 담겼다.

EXAONE이 만든 호박 모양의 모자ⓒ 데일리포스트=이미지 제공/LG전자

이 같은 멀티 모달 AI를 개발하기 위해 LG AI연구원은 세계 최대 규모의 학습 데이터를 활용했다. EXAONE은 말뭉치 6000억개 및 언어와 이미지가 결합되어 있는 고해상도 이미지 2억5000만장 이상을 학습했다.

EXAONE은 LG전자, LG화학, LG유플러스, LG CNS 등 LG 계열사들이 보유하고 있는 전문 데이터를 포함해 논문, 특허 등의 정제된 말뭉치들을 학습해 다양한 산업 분야에서 전문가로 활약할 수 있는 가능성을 높여 가고 있다.  

또 미국 AI연구소 오픈AI가 개발한 초거대 AI인 GPT-3가 영어를 학습하고, 국내에서 개발 중인 다른 초거대 AI들이 한국어에 집중하는 것과 달리 'EXAONE'은 원어민 수준으로 한국어와 영어를 이해하고 구사하는 이중 언어 AI라는 점도 차별화 포인트다.

LG AI연구원은 집단 지성으로 초거대 AI 생태계를 조성하기 위한 3단계 계획도 발표했다. LG 계열사와의 협업을 통한 실증, 국내를 포함한 글로벌 AI 연합 결성해 활용 영역 확대, 초거대 AI 대중화를 통한 상생 환경 구축 등을 내용으로 한다. AI연구원은 EXAONE을 제조, 연구, 교육, 금융 등 사실상 모든 분야에서 '상위 1% 수준의 전문가 AI'로 활약할 수 있도록 만든다는 계획이다.

궁극적으로 초거대 AI를 일부 기업이 독점하는 것이 아니라, 일반 대중까지 공개하는 대중화를 통한 상생 환경 구축 방안도 검토 중이다.

배경훈 LG AI연구원장은 "어려운 난제를 해결하기 위해 끊임없이 도전하고, 우수한 연구 성과를 바탕으로 고객에게 꼭 필요한 전문가 AI를 만드는 연구원이 되고자 한다"며 "캐나다 토론토대, 미국 미시건대, 서울대, 카이스트 등 국내외 주요 대학 및 석학들과 연구개발 연계 체계를 더욱 강화하고, 향후 API(Application Programming Interface) 공개 및 외부 파트너십을 통해 집단 지성으로 글로벌 초거대 AI 생태계를 만드는 데 기여할 것"이라고 말했다. 

저작권자 © 데일리포스트 무단전재 및 재배포 금지