아티클

논문분석부터 실험 설계·수행까지…'연구자AI' 시대 열린다

[2024 키플랫폼] 특별세션1 발표 이경하 한국과학기술정보연구원(KISTI) 초거대AI연구단장

남미래 | 2024.04.25 17:24

image
이경하 한국과학기술정보연구원 초거대AI연구단장이 25일 영등포구 여의도 콘래드서울호텔에서 머니투데이 주최로 열린 '2024 키플랫폼' 총회 특별세션에서 '생성형 LLM 현황과 KISTI 의 전략'을 주제로 발표하고 있다. /사진=김휘선
"2020년 세계 상위 10개국의 SCI(과학기술논문 인용색인) 논문 출판 건수는 연 195만 편에 달할 정도로 연구자가 소비할 정보가 급속도로 늘어나고 있습니다. 이에 한국과학기술정보연구원(KISTI)는 과학기술의 경쟁력을 높이고 연구 생산성을 높이기 위한 '연구자AI'를 만들고자 합니다."

이경하 KISTI 초거대AI연구단장은 25일 서울 여의도 콘래드 서울 호텔에서 열린 머니투데이 글로벌 콘퍼런스 '2024 키플랫폼'(K.E.Y. PLATFORM 2024) 특별세션1에서 '생성형 거대언어모델(LLM) 현황과 KISTI의 전략'을 주제로 발표하며 이같이 말했다.

이 단장은 오픈AI의 챗GPT, 메타의 라마(LIama) 등 LLM이 등장한 이후, 특정 영역에 특화된 LLM인 소형언어모델(sLLM)에 대한 수요가 높아지고 있다고 분석했다.

이 단장은 "LLM은 학습 데이터 양을 늘리면 늘릴수록 성능이 좋아지는 특성이 있기 때문에 데이터 학습 비용이 굉장히 높다"며 "기업들은 보안 데이터가 외부에 유출될 가능성이 있어 LLM을 파인튜닝(이미 훈련된 LLM에 특정 데이터셋으로 추가 학습을 수행하는 작업)해 사용하는 sLLM에 대한 수요가 높아지고 있다"고 말했다.

이러한 경향에 맞춰 KISTI는 과학기술연구에 특화된 sLLM을 만들고 이를 기반으로 연구자 지원 서비스를 준비 중이다. 이 단장은 "매일 1만편의 논문이 쏟아지는 만큼 정보량이 방대해졌다"며 "하나의 논문만 요약하는 것이 아니라 방대한 양의 논문을 분석해 연구 취약점, 향후 연구 계획 등을 추출하는 것이 목표"라고 말했다.

더 나아가 LLM이 실험을 설계하고 수행하는 역할까지 지원할 계획이다. 이 단장은 "지난해 말 네이처지에 발간된 논문의 연구는LLM을 활용해 복잡한 실험을 자율, 설계, 수행하며 모든 과정을 몇 분만에 완료했다"며 "이제 LLM이 논문을 분석하는 단계를 넘어 실험 방법을 수립하고 수행하는 데 활용할 수 있는 수준까지 이르렀다"고 설명했다.

그러면서 "한국어에 특화된 언어모델을 갖고 이를 기반으로 논문, 보고서 분석을 넘어 연구 과정을 지원하는 '연구자AI'를 만들고 보급하는 것이 목표"라며 "개발한 LLM 기술력을 기반으로 다른 특정 분야의 sLLM에 대한 수요에 대응하겠다"고 말했다.