아티클

네덜란드통계청 '빅데이터 통계로 미래를 읽다'

[미리보는 2016 키플랫폼: 4차산업혁명 대응전략] <인터뷰>⑲ 차크 친아초이 CBS 청장

헤이그(네덜란드)=배영윤 | 2016.04.08 06:01

image
네덜란드 정부 도시 헤이그에 위치한 CBS(Centraal Bureau voor de Statistiek, 네덜란드 통계청) 전경./사진=배영윤 기자
알파고가 이세돌을 이길 수 있었던 데에는 '빅데이터'의 공이 크다. 엄청난 양의 기보(빅데이터)를 축적하고, 자체 스터디(딥러닝)를 통해 단기간에 '인간 최고' 이세돌을 꺾을 수 있었다. 빅데이터가 인공지능의 수준을 몇 단계 끌어올린 셈이다.

모든 분야에서 빅데이터를 빼놓고 얘기할 수 없는 시대다. 빅데이터를 통해 모든 일을 쉽고, 빠르고, 정확하게 처리할 수 있게 됐다. 특히 통계 분야에서 가장 빛난다. 샘플링을 통해 모수(전체수) 추정의 과정을 거치지 않고도 전체 집단에 관한 데이터를 얻을 수 있다.

빅데이터 분석은 기존 통계분석과 접근 방식부터 다르다. 방대한 양의 모수 안에 숨겨진 패턴을 찾고 해석함으로써 의미있는 결과를 도출한다. 빅데이터를 '제대로' 다룰 줄 아는 IT 전문가가 필요한 이유다.

네덜란드 통계청(CBS·Centraal Bureau voor de Statistiek)은 일찌감치 빅데이터 시대를 위한 환경을 구축했다. 전문가들을 모으고 빅데이터 연구를 위한 별도 조직도 만들었다. 빅데이터 전문 지식을 대거 축적한 기업과 연구기관, 학교와 꾸준히 협업한다. CBS가 하는 사업, CBS가 만든 자료는 누구나 공유할 수 있도록 '오픈 소스' 형태로 공개된다.

머니투데이 글로벌 콘퍼런스 '2016 키플랫폼'(K.E.Y. PLATFORM 2016) 특별취재팀은 지난 1월 네덜란드 헤이그에 있는 CBS를 찾았다. 차크 친아초이(Tjark Tjin-A-Tsoi) 청장과 마셀 반 데어 스틴(Marcel van der Steen) 혁신사업개발 매니저를 만나 빅데이터 시대를 앞서가는 비결을 들어봤다.

image
차크 친아초이(Tjark Tjin-A-Tsoi) 통계청장(CBS Director General)/사진=배영윤 기자


- 빅데이터의 활용도가 가장 높은 곳이 통계 분야이다. 과거와 달라진 점이 있다면.
▶빅데이터를 통해 많은 양의 데이터를 수집하고 목적에 맞게 구체화한다. 그것을 토대로 통계 자료를 만들고 발표한다. 전통적인 데이터 수집 방법은 사람들을 일일이 찾아가 관련 질문을 하는 방식이다. 하지만 빅데이터가 등장하고부터 전통적인 데이터 수집 방식을 버렸다. 사람들도 데이터 수집을 위한 질문 받기를 꺼려한다. 이미 우리 주변에는 엄청난 양의 데이터가 있다. 사람들을 더 이상 귀찮게 하지 않고도 필요한 데이터를 얻고 자료를 만들 수 있다.

- 구체적인 사례를 소개해 달라.
▶물가상승률을 조사할 때 과거엔 직접 상점들을 찾아갔다. 제품 가격을 일일이 수기로 적어 샘플을 수집하고, 그 가격들의 평균을 내고, 물가상승률을 계산했다. 지금은 매장 카운터에서 바코드를 찍어 얻은 정보들이 자동으로 수집된다. 거래 정보를 통해 쉽게 물가상승률을 도출할 수 있다. 모든 과정이 자동이다.

- 또 어떻게 빅데이터를 활용하나.
▶CBS는 주로 대학, 도시 등 공공 차원의 데이터를 수집한다. 네덜란드에 있는 모든 도로에 센서를 장착했다. 대략 80TB(테라바이트)의 데이터가 수집됐다. 이동 차량의 종류, 하루 동안 교통량 등 교통 상황에 관한 모든 정보를 얻을 수 있다. 이를 통해 특정 도로, 특정 시간의 교통량도 측정할 수 있다. 예전에는 운전자를 붙잡고 직접 물어 얻을 수 있었던 정보들이 자동으로 빠른 시간 내에 수집이 가능해졌다.

통신회사에서 수집한 휴대폰 사용 관련 정보도 활용한다. 여행 관련 데이터를 수집할 수 있다. 사람들이 어느 지역에 가 있는지 파악할 수 있기 때문이다. 또 소셜미디어를 통해 소비자신뢰지수를 만들 수 있는지 파일럿 스터디를 진행했다. 트위터나 페이스북에서 키워드를 수집해 자료를 만들었는데 꽤 긍정적인 결과를 얻었다.

image
마셀 반 데어 스틴(Marcel van der Steen) 혁신 사업 개발 매니저(Manager Innovation and Business Development)/사진=배영윤 기자
- 최근 빅데이터 기반 통계 자료를 통해 분석한 글로벌 경제 동향 중 주목할 만한 것이 있나.
▶글로벌화는 여전히 현재 진행형이다. 기술의 발전이 노동력 구조를 변화시키고 있다. 단순 노동이 자동화되면서 단순 기술을 보유한 이들의 일자리가 줄고 있다. 과거 많은 기업들이 저렴한 인건비 때문에 중국, 대만 등지에서 생산기지를 세우는 '아웃소싱 시스템'을 운영해 왔다. 하지만 이러한 시스템에 변화가 감지됐다. 자동화, 기계화되면 저렴한 노동력이 최대 강점인 '아웃소싱'은 더 이상 의미가 없어진다. 변화된 생산 시스템이 생산 비용을 낮추면서 아웃소싱에서 인소싱 시스템으로 변하게 될 것이다. 변화에 대한 대비가 필요하다고 생각한다.

- 조직 내부와 외부에서 어떻게 빅데이터를 연구하고 활용하는가.
▶빅데이터를 가지고 여러 실험을 하는 '빅데이터 연구실'(Big data Lab)과 같은 별도 조직이 있다. 최근에는 대학교와 함께 '데이터 캠퍼스'(DATA CAMPS) 프로그램도 진행했다. 일주일 동안 모여서 빅데이터와 관련된 토의와 연구를 했다. 프로그램 참가자들이 빅데이터를 활용한 새로운 솔루션 개발에 의욕적이었다.

지난 2011년에는 한국 통계청과 업무협약 양해각서(MOU)를 맺었다. 서로의 경험을 토대로 아이디어를 공유하고 인적 자원도 교류한다. 앞으로 다른 나라와도 협업을 하는 등 빅데이터를 활용한 혁신적인 솔루션을 찾기 위한 노력을 계속할 계획이다.

image
CBS 내부 모습. 뉴스룸을 갖추고 있어 중요하거나 긴급한 사안은 자체적으로 콘텐츠를 생산해 발표하기도 한다./사진=배영윤 기자


- 협업을 중시하는 것 같다.
▶이미 많은 대학과 연구기관, 기업들이 빅데이터에 대한 연구를 진행해 왔다. 만약 우리 힘만으로 연구에 매진한다면 비용과 시간이 많이 소모될 것이다. 관련 지식을 축적한 대학, 기업과 함께 정보를 공유하면 비용과 시간을 절감할 수 있다. 우리가 이들과 협업하는 이유다.

- 빅데이터가 앞으로 어떤 영향을 미칠 것으로 보는가.
▶빅데이터를 활용하면 사회와 관련된 더 나은 통계 자료를 더 많이 만들 수 있다. 실질적인 정보를 쉽게 얻을 수 있어 개인과 정부의 의사결정 속도도 단축될 것이다.

- 개인정보 침해 논란도 있는데.
▶네덜란드에서 개인정보 보호는 굉장히 중요하다. 개인정보 보호는 확실히 보증한다. 수집된 데이터에서 이름 등 개인정보는 삭제하고, 순전히 통계 산출을 위해서만 사용된다. 그 외에 어떠한 용도로도 사용하지 않는다.

image
(위)지난 5일(현지시간) CBS는 정보를 한눈에 볼 수 있는 디자인으로 웹사이트를 개편했다.(아래)CBS는 매년 공식 통계 자료를 통합한 소책자를 발간한다. 깔끔한 디자인이 돋보이는 시각 자료를 적절히 사용해 어려운 내용도 쉽게 이해할 수 있도록 구성한 점이 특징이다./사진=CBS 공식 트위터, 배영윤 기자


- 투명성을 증명하기 위해 하고 있는 노력은.
▶대중과의 소통이 중요하다. 대중들이 CBS가 어떤 일을 하는지 알 수 있도록 다방면으로 노력한다. 완성된 통계 자료가 광범위하게 활용될 수 있도록 홈페이지에 공개한다. 미디어를 통하면 좀더 효율적으로 소통할 수 있다. CBS 내에는 자체 뉴스룸도 있어 대변인의 인터뷰를 TV 뉴스에 직접 제공하기도 한다. 소셜미디어를 통해서도 활발히 소통하고 있다.