![]() |
이준학 KISTI(한국과학기술정보연구원) 디지털바이오컴퓨팅연구단장 /사진=박건희 기자 |
한국과학기술정보연구원(KISTI)이 초고성능 컴퓨팅 인프라를 기반으로 '한국인 100만명' 바이오 빅데이터 구축에 참여한다.
한국인의 단백질, 유전체, 대사체, 생활정보(라이프로그) 등을 통합한 빅데이터를 구축하는 '국가 통합 바이오 빅데이터 구축 사업'이다. 수집한 데이터는 대학 및 병원, 기업 연구자 등 정밀의료 기술, 신약, 디지털헬스 서비스 개발 등 바이오분야 연구에 제공한다. 우선 2028년까지 약 77만명의 데이터를 수집할 계획이다.
이준학 디지털바이오컴퓨팅연구단장(사진)은 "유전체, 단백질, 대사체 등 다양한 종류의 전주기 데이터를 통해 질병진단과 치료법 등 파악할 수 있는 것이 너무나 많다"며 "혁신적 성과가 계속해서 나올 수 있도록 바이오 생태계를 조성하는 게 사업의 핵심"이라고 설명했다.
통합 데이터 관리시스템이 부재했던 지금까지는 각종 바이오 데이터가 개별 연구자, 연구기관, 공공기관 등에 흩어져 있어 각종 중요한 데이터를 한눈에 파악할 수 없었다.
국가생명연구자원정보센터(KOBIC)와 KISTI가 운영하는 '국가바이오데이터스테이션'(K-BDS)은 이에 대한 해결책이다. K-BDS는 국가의 지원을 받아 나온 바이오 R&D(연구·개발)사업의 연구데이터를 등록하는 플랫폼이다. 시스템에 등록한 데이터는 연구성과로 인정해 다음 국가 R&D사업 지원시 가산점을 부여한다. 데이터를 등록한 연구팀에는 KISTI가 보유한 대규모 컴퓨팅 기반의 연구환경을 무료로 제공한다. K-BDS에 등록된 바이오 데이터는 후속 연구자 누구나 활용할 수 있다.
이 단장은 "자체 컴퓨팅 자원이 부족한 대학 및 연구기관의 연구자는 KISTI가 보유한 고성능 컴퓨팅 인프라를 활용할 수 있고 연구계는 서로의 연구성과물을 활발히 공유하며 더 혁신적인 아이디어도 얻을 수 있을 것"이라고 했다.
'데이터 주권'의 시각에서도 자체 데이터베이스 시스템을 갖추는 게 필요하다는 지적이다. 연구성과를 국제 학계에서 인정받으려면 논문에 활용한 데이터를 정보센터 등에 등록해야 한다. 미국, 유럽, 일본이 데이터베이스 시스템을 구축한 대표적인 국가인데 국내 연구자는 대개 미국 국립생물정보센터(NCBI)에 데이터를 등록한다. 이 단장은 "한국의 바이오 R&D분야 역량을 미국 서버에 맡기는 모양새인데 우리나라 자체 서버에 자체적으로 데이터를 저장할 필요가 있다. K-BDS가 그 역할을 할 것"이라고 했다.
다만 K-BDS를 향한 연구계의 관심도는 계속 높아지는 데 반해 이를 감당할 서버는 버거운 수준이다. K-BDS사업은 1년에 3회, 총 40여개팀을 모집하는데 올해 첫 공모에만 이미 40여개팀이 지원한 상황이다. KISTI는 바이오 계산자원에 대한 수요가 커지는 만큼 2027년까지 K-BDS를 확대해 제공할 수 있도록 준비할 계획이다.
![]() |
K-바이오데이터스테이션(K-BDS) 개념도 /사진=KISTI |