Article

정확도·보안 높인 특화형 AI '스파크'…"공공 부문 AI 전환 이끈다"

[2025 키플랫폼] 특별세션1- 기조강연1 오태석 KISTEP 원장 "공공기관 AI전환의 스파크(SPARK)를 일으키다"

박건희 | 2025.04.24 16:50

image
오태석 한국과학기술기획평가원 원장이 24일 영등포구 콘래드 서울 호텔에서 머니투데이 주최로 진행된 '2025 키플랫폼' 특별세션에서 '공공기관 AI전환의 스파크(SPARK)를 일으키다'에 대해 기조강연을 하고 있다. /사진=김창현 chmt@

KISTEP(한국과학기술기획평가원)이 공공기관 AI(인공지능)의 '프런티어'로 나섰다. 자체 개발한 과학기술혁신정책 특화형 AI를 통해 기관 본연의 기능을 강화하고 나아가 우리나라 공공부문의 AI 전환을 적극적으로 지원한다는 구상이다.

24일 서울 여의도 콘래드 호텔에서 열린 머니투데이 글로벌 콘퍼런스 '2025 키플랫폼'(K.E.Y. PLATFORM 2025)에서 기조강연자로 선 오태석 KISTEP 원장은 "생성형 AI 도입으로 공공기관이 얻을 수 있는 효과가 명백하다"며 KISTEP 자체 소형언어모델(SLM) '스파크(SPARK)' 개발 배경을 밝혔다.

스파크는 과학기술혁신정책 특화 언어모델이다. KISTEP의 연구보고서 2500건, 정부 회의체 및 위원회 자료 200건, 국회 자료 1000건 등 총 5000건 넘는 신뢰도 높은 과학기술정책 공공문서를 중심으로 학습했다. KISTEP은 스파크를 활용해 △질의응답 △문서 요약 △보고서 목차 및 초안 생성 서비스를 제공하는 자체 AI 서비스 '키스텝-젠(KISTEP-GEN)'을 지난 2월 개시했다.

오 원장은 "민간 기업이 이미 발빠르게 생성형 AI를 도입, 활용하는 가운데 공공부문 종사자도 기관내 생성형 AI를 도입해야 할 필요성을 인식하고 있다. 데이터 분석력을 높이는 한편 보고서 작성 및 커뮤니케이션 자동화를 통해 업무 효율성을 높일 수 있을 것으로 기대한다"고 했다.

image
오태석 한국과학기술기획평가원 원장이 24일 영등포구 콘래드 서울 호텔에서 머니투데이 주최로 진행된 '2025 키플랫폼' 특별세션에서 '공공기관 AI전환의 스파크(SPARK)를 일으키다'에 대해 기조강연을 하고 있다. /사진=김창현 기자 chmt@

그럼에도 공공부문의 AI 도입이 늦는 이유는 단연 보안 문제다. 공공기관이 다루는 민감한 국가 정보가 AI 활용 중 외부로 유출될 가능성을 우려한다. 오 원장은 "더불어 AI 개발 및 운영에 필요한 전문인력과 기술역량을 제때 확보하기 어렵고, 도입을 위한 별도 예산을 확보하기도 어려운 상황"이라고 진단했다. 조직문화 차원의 문제도 있다. AI 도입 후 성과를 내는 데 실패할 경우 누가 책임을 질 것인가에 대한 '책임 소재' 문제부터 변화에 대한 저항 등이 현장에서 나타난다.

오 원장은 "AI 도입을 추진하다 테스트나 PoC(개념검증) 단계에서 멈추거나 아예 무산된 수많은 공공기관이 있다"며 "4년째 AI 도입을 추진해온 KISTEP도 이같은 문제를 겪었다"고 했다.

그는 "그럼에도 KISTEP은 AI 도입을 지체할 수 없었고, 끝까지 밀어붙였다"고 했다. 키스텝은 실제 2월부터 키스텝-젠을 도입, 많은 연구원이 실제 업무에 활용하고 있다. 오 원장은 "국내외 방대한 자료를 조사한 후 분석하고 전문가의 의견을 받아 최종결과물을 만드는 게 KISTEP의 주요 업무 과정인데, 이중 반복적으로 계속되는 작업을 줄여줄 효율적인 자료 분석 도구로서 AI가 가져올 질적 제고 효과가 명백했다"고 했다.

스파크의 기반이 되는 언어모델은 젬마(Gemma)와 미스트랄(Mistral)로 오픈소스 커뮤니티에서 가져왔다. 이를 통해 개발 비용을 크게 줄였다. 과학기술 용어를 처리하기 위해 통합 AI 인프라 플랫폼 'AI허브'의 과학기술 데이터를 학습했고, 오픈소스 커뮤니티에 공개된 고품질 데이터를 추가 학습해 자연스러운 응답을 생성했다. 더불어 KISTEP이 10년여간 축적한 국가연구개발 조사분석 데이터 약 45만건을 학습시켜 정보의 정확성을 높였다.

image
키스텝-젠 실행 화면 /사진=KISTEP

KISTEP 연구팀이 스파크를 오픈 AI의 '챗 GPT-4o-미니'와 비교한 결과, 정확도는 높아지고 할루시네이션(환각)은 낮아졌다. 할루시네이션은 AI가 질문에 맞춰 근거 없는 허위 정보를 생성하는 현상을 말한다. 정성평가 결과, 피드백을 반영해 학습한 스파크의 성능은 94.1%를 기록했다.

무엇보다 공공기관에서 활용하는 AI인 만큼 보안을 강화했다. 외부와 완전히 단절된 '온프레미스'(on-premise) 방식을 채택했다. 모든 데이터 처리가 KISTEP 내부망에서 이뤄지며 외부 상용 클라우드나 API(애플리케이션프로그램인터페이스)는 전혀 사용하지 않았다.

실제 키스텝 내부에서는 키스텝-젠에 대해 "필요한 자료를 찾아주기 때문에 전임자나 동료 직원에게 일일이 물어보지 않아도 업무의 맥락을 훨씬 빠르게 이해할 수 있었다"는 평가가 나왔다. 또 "위원회 회의 종료 후 회의록을 정리하는 데 많은 시간이 소요됐는데 AI가 번역을 비롯해 핵심을 요약해줘 업무에 드는 시간이 대폭 줄었다"는 후기도 나왔다.

오 원장은 "올해 계속해서 다양한 연구기관의 정책자료도 추가해 AI 서비스의 질을 높일 계획"이라며 "KISTEP의 목표는 'AI 일상화'"라고 강조했다. 그는 "누구나 AI를 활용할 수 있고 어떤 업무에서든 AI를 활용할 수 있도록 1부서 1 AI 서비스를 개발할 것"이라고 했다.

더불어 "오픈소스 커뮤니티인 '허깅페이스'에 스파크 모델을 공개한 만큼 상업적 목적이 아니라면 어느 기관이나 활용할 수 있다"고 했다. 그러면서 "키스텝-젠 사례를 확산해 유관 공공기관의 AI 전환을 견인하겠다"고 밝혔다.