'논문보고 학습' LG 엑사원 2.0 '생성형AI' 한계극복

AI토크콘서트 개최…'엑사원 2.0', 3대 플랫폼 공개
4500만건 전문문헌, 3억5000만장 이미지로 학습
허구사실 만드는 생성형 AI '환각' 현상 최소화

배경훈 LG AI연구원장이 19일 마곡 LG사이언스파크 ISC에서 열린 'LG AI 토크콘서트 2023'에서 초거대 AI 엑사원 2.0을 소개하고 있다.[사진=장민제 기자]

LG가 논문 등 전문자료로 학습시킨 초거대 인공지능(AI) 엑사원 2.0을 세상에 내놓는다. 여타 생성형 AI에 비해 잘못된 정보를 전달하는 ‘환각’ 현상을 최소화 한 게 특징이다. 전문가 수준 AI모델로 LG는 엑사원 2.0을 신소재·신물질·신약 개발에 투입, 시행착오와 연구개발 시간을 줄인다는 계획이다.

LG AI연구원은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 ‘LG AI 토크 콘서트 2023’을 열고 초거대 멀티모달 AI ‘엑사원(EXAONE) 2.0’을 공개했다. ‘엑사원’은 LG AI연구원이 2021년 12월 첫 선을 보인 AI모델이다.

이번에 공개한 ‘엑사원 2.0’은 최근 산업계에서 주목받은 생성형 AI의 단점을 해결한 게 특징이다. AI 답변의 신뢰성과 비용대비효율, 내부 데이터 유출우려 등을 해소했다.

엑사원 2.0은 파트너십을 통해 확보한 특허, 논문 등 약 4500만건의 전문 문헌과 3억5000만장의 이미지를 학습했다. 특히 한국어와 영어를 동시에 이해하고 답변할 수 있는 이중 언어(Bilingual) 모델로 개발해 학습 데이터양도 기존대비 4배 이상 늘렸다.

경량화에도 성공했다. 대규모 언어 모델(LLM)은 최적화로 추론(Inference) 처리 시간을 25% 단축했고 메모리 사용량은 70% 줄였다. 비용은 약 78% 절감했다. 멀티모달 모델은 이미지 생성 품질을 높이기 위해 기존 모델 대비 메모리 사용량을 2배 늘렸지만 추론 처리 시간을 83% 단축했다. 비용은 약 66% 줄었다.

배경훈 LG AI연구원장은 “기존 생성형 AI와 확연하게 차별화된 엑사원 2.0을 소개한다”며 “전문지식에 특화됐고 종합적 추론과 논리적 사고가 가능하다. 단순 유창하게 말하는 걸 넘어 사실적 근거에 답하는데 집중했다”고 설명했다.

LG AI연구원은 대표적인 엑사원 활용 사례로 LG전자의 AICC(AI 컨택 센터)를 소개했다. 이어 엑사원 2.0의 3대 플랫폼인 △전문가용 대화형 AI 플랫폼 ‘엑사원 유니버스’ △‘엑사원 디스커버리’ △‘엑사원 아틀리에’를 내세웠다.

AICC는 고객과의 상담 내용을 실시간으로 분석·요약하고 상담 내용에 적합한 답변이나 콘텐츠를 제안한다. LG AI연구원은 국내에서 시범 운영 중인 AICC를 하반기 중 정식 서비스로 전환할 예정이며 내년부터 영어권 국가로 확대할 계획이다.

엑사원 유니버스는 △질의응답·대화 △텍스트 분류·요약 △키워드 추출·생성 △번역 등 기능별로 메뉴를 나눴던 방식에서 전문가용 대화형 AI 플랫폼으로 완전히 탈바꿈했다.

LG AI연구원은 엑사원 유니버스를 각 분야의 전문가들이 믿고 정보를 탐색하며 인사이트를 찾을 수 있는 플랫폼으로 만들기 위해 전문성과 신뢰성을 높이는 데 주력했다고 설명했다.

엑사원 유니버스는 다른 대화형 AI들과 달리 사전 학습한 데이터는 물론 각 도메인별 최신 전문 데이터까지 포함해 근거를 찾아내며 추론한 답변을 생성한다. 화면 좌우에 질문과 연관성이 가장 높은 전문 문헌, AI가 답변하는 과정에서 활용한 단락을 표시한다.

LG AI연구원은 이날 시연한 엑사원 유니버스의 AI·머신러닝 분야 서비스를 7월31일부터 LG 그룹 내 AI 연구자, 협력 중인 대학을 대상으로 시작한다. 9월에는 LG에서 AI를 연구하거나 공부하는 임직원 대상으로 정식 서비스를 진행할 계획이다. 아울러 화학, 바이오, 제약, 의료, 금융, 특허 등 엑사원 유니버스의 각 전문 도메인별 특화 서비스도 준비하고 있다.

엑사원 디스커버리는 세상에 없던 새로운 지식을 발견하는 플랫폼이다. 가장 먼저 신소재·신물질·신약 관련 탐색에 적용하고 있다.

LG AI연구원이 19일 마곡 LG사이언스파크 ISC에서 열린 'LG AI 토크콘서트 2023'에서 엑사원 유니버셜의 정확도 등을 설명하고 있다.[사진=장민제 기자]

LG AI연구원은 엑사원 디스커버리에 논문과 특허 등 전문 문헌의 텍스트뿐만 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등 비텍스트 정보까지 AI가 읽고 학습할 수 있는 형태로 데이터베이스화 하는 심층 문서 이해(DDU) 기술을 적용했다.

LG AI연구원은 LG의 심층 문서 이해 기술이 세계 최고 수준임을 강조했다.

LG AI연구원은 이날 친환경 배터리 개발에 활용할 수 있는 첨가제 소재의 개발을 주제로 엑사원 유니버스와 엑사원 디스커버리를 연계해 AI에 질문하며 △전문 문헌 검토 △분자 정보 추출 △소재 구조 설계(UMD) △소재 합성 예측(NCS) 등 후보 소재를 찾아내 합성 결과를 예측하는 과정을 시연했다.

LG AI연구원은 엑사원 디스커버리를 통해 1만회가 넘었던 합성 시행착오를 수십회로 줄이고, 연구개발 소요 시간은 40개월에서 5개월로 단축시킬 수 있을 것으로 예상했다.

LG AI연구원은 올해 4분기에 그룹 내 화학 및 바이오 분야 연구진들을 대상으로 엑사원 디스커버리 서비스를 제공할 예정이다. 이를 통해 신소재·신물질·신약 관련 연구개발에 혁신을 불러올 것으로 기대하고 있다.

‘엑사원 아틀리에’는 인간에게 창의적 영감과 아이디어를 제공하기 위해 개발한 플랫폼이다. 이미지 생성과 이미지 이해에 특화된 기능을 제공한다.

LG AI연구원은 인간과 AI가 상호작용을 통해 디자인을 완성해가는 ‘디자인 싱킹 프로세스(Design Thinking Process)’를 엑사원 아틀리에에 접목하기 위해 미국 파슨스 디자인 스쿨과의 공동 연구개발을 이어가고 있다고 설명했다. 또, 지난 6월 셔터스톡(Shutterstock)과 함께 상용화한 ‘캡셔닝 AI’ 기능도 엑사원 아틀리에에 탑재했다.

캡셔닝 AI는 처음 보는 이미지까지 자연어로 설명할 수 있으며, 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등의 메타 데이터를 생성한다.

LG AI연구원은 이날 제품 이미지를 보고 마케팅 문구 등을 생성하는 엑사원 아틀리에의 새로운 서비스를 시연했다. LG AI연구원은 올해 3분기에 그룹 내외부의 전문 디자이너를 대상으로 엑사원 아틀리에 서비스를 시작한다.

배 연구원장은 “LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업”이라며 “세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다”고 강조했다. 이어 “국내외 파트너사와의 협력을 통해 실질적인 성공 사례를 만들어가며 ‘다른 생성형 AI들과는 차별화된 고객 가치’를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전해 나갈 것”이라고 덧붙였다.

한편 구광모 LG 회장은 2018년 LG 대표 취임 후 AI를 미래 성장 동력으로 집중 육성 중이다. 2020년 그룹 AI 연구의 싱크탱크 역할을 할 ‘LG AI연구원’을 설립했다. 지난해에는 향후 5년 간 AI·데이터 분야 연구개발에 3조6000억원을 투입해 미래 기술을 선점하고 인재 영입도 적극 나서기로 했다.

[신아일보] 장민제 기자

jangstag@shinailbo.co.kr