아티클

'AI 바이오 혁명' 위해…'100만 한국인' 데이터 모아 R&D 생태계 조성

[2025 키플랫폼 - 새로운 미래를 여는 K-과학기술: AI, 바이오, 양자컴 기술 혁신 ] KISTI(한국과학기술정보연구원)

대전=박건희 | 2025.04.15 13:59

image
이준학 KISTI(한국과학기술정보연구원) 디지털바이오컴퓨팅연구단장 /사진=박건희 기자

한국과학기술정보연구원(KISTI)이 초고성능 컴퓨팅 인프라를 기반으로 '한국인 100만명' 바이오 빅데이터 구축에 참여한다.

한국인의 단백질, 유전체, 대사체, 생활정보(라이프로그) 등을 통합한 빅데이터를 구축하는 '국가 통합 바이오 빅데이터 구축 사업'이다. 수집한 데이터는 대학 및 병원, 기업 연구자 등 정밀의료 기술, 신약, 디지털헬스 서비스 개발 등 바이오분야 연구에 제공한다. 우선 2028년까지 약 77만명의 데이터를 수집할 계획이다.

이준학 디지털바이오컴퓨팅연구단장(사진)은 "유전체, 단백질, 대사체 등 다양한 종류의 전주기 데이터를 통해 질병진단과 치료법 등 파악할 수 있는 것이 너무나 많다"며 "혁신적 성과가 계속해서 나올 수 있도록 바이오 생태계를 조성하는 게 사업의 핵심"이라고 설명했다.

통합 데이터 관리시스템이 부재했던 지금까지는 각종 바이오 데이터가 개별 연구자, 연구기관, 공공기관 등에 흩어져 있어 각종 중요한 데이터를 한눈에 파악할 수 없었다.

국가생명연구자원정보센터(KOBIC)와 KISTI가 운영하는 '국가바이오데이터스테이션'(K-BDS)은 이에 대한 해결책이다. K-BDS는 국가의 지원을 받아 나온 바이오 R&D(연구·개발)사업의 연구데이터를 등록하는 플랫폼이다. 시스템에 등록한 데이터는 연구성과로 인정해 다음 국가 R&D사업 지원시 가산점을 부여한다. 데이터를 등록한 연구팀에는 KISTI가 보유한 대규모 컴퓨팅 기반의 연구환경을 무료로 제공한다. K-BDS에 등록된 바이오 데이터는 후속 연구자 누구나 활용할 수 있다.

이 단장은 "자체 컴퓨팅 자원이 부족한 대학 및 연구기관의 연구자는 KISTI가 보유한 고성능 컴퓨팅 인프라를 활용할 수 있고 연구계는 서로의 연구성과물을 활발히 공유하며 더 혁신적인 아이디어도 얻을 수 있을 것"이라고 했다.

'데이터 주권'의 시각에서도 자체 데이터베이스 시스템을 갖추는 게 필요하다는 지적이다. 연구성과를 국제 학계에서 인정받으려면 논문에 활용한 데이터를 정보센터 등에 등록해야 한다. 미국, 유럽, 일본이 데이터베이스 시스템을 구축한 대표적인 국가인데 국내 연구자는 대개 미국 국립생물정보센터(NCBI)에 데이터를 등록한다. 이 단장은 "한국의 바이오 R&D분야 역량을 미국 서버에 맡기는 모양새인데 우리나라 자체 서버에 자체적으로 데이터를 저장할 필요가 있다. K-BDS가 그 역할을 할 것"이라고 했다.

다만 K-BDS를 향한 연구계의 관심도는 계속 높아지는 데 반해 이를 감당할 서버는 버거운 수준이다. K-BDS사업은 1년에 3회, 총 40여개팀을 모집하는데 올해 첫 공모에만 이미 40여개팀이 지원한 상황이다. KISTI는 바이오 계산자원에 대한 수요가 커지는 만큼 2027년까지 K-BDS를 확대해 제공할 수 있도록 준비할 계획이다.

image
K-바이오데이터스테이션(K-BDS) 개념도 /사진=KISTI