![]() |
최석재 테크놀러지 그룹 상무가 24일 영등포구 콘래드 서울 호텔에서 머니투데이 주최로 진행된 '2025 키플랫폼' 특별세션에서 'AI-Ready Data: AI에 준비된 데이터 아키텍처 및 혁신 전략'에 대해 발표하고 있다. /사진=김창현 chmt@ |
"AI(인공지능)를 활용한 결과물이 성공적이냐 아니냐를 구분하는 건 데이터를 어떻게 활용하느냐에 달려있습니다"
최석재 한국IBM테크놀러지 그룹 상무는 24일 서울 여의도 콘래드 호텔에서 열린 머니투데이 글로벌 콘퍼런스 '2025 키플랫폼'(K.E.Y. PLATFORM 2025)에서 "양질의 데이터가 있을 때 양질의 아웃풋(output·결과물)"이 나온다며 이같이 말했다.
최 상무는 이날 데이터 플랫폼 아키텍트로서 'AI Ready Data(AI에 준비된 데이터)' 등 어려운 개념을 쉽게 풀어냈다. 데이터 분석가가 한 회사의 의뢰를 받아 고객 이탈을 예측하는 모델을 만든다는 가정을 두고, 데이터를 정리하는 방법부터 AI 활용까지 전체 과정을 단계적으로 발표했다.
최 상무는 AI를 활용하기 전 양질의 데이터를 만들기 위한 '정리 단계'가 필수적이라고 설명했다. 그는 "때때로 필요한 데이터 소스(source)가 여러 곳에 분포돼있거나 데이터가 고립돼있고, 오래된 쓰레기 데이터도 있다"며 "다양한 데이터 소스들을 실시간·배치·복제 등 다양한 기법으로 모은다"고 했다.
하지만 단순히 모으는 것만으로는 데이터를 분석하고 활용하기 충분하지 않다고 강조했다. 여전히 데이터가 정리되지는 않은 데다 빠진 데이터나 중복된 데이터가 많다는 지적이다. 최 상무는 이를 해결하는 다음 단계로 '데이터 거버넌스' 필요성을 제시했다. 분석하고자 하는 데이터를 보기 쉽고 알 수 있게 만들어야 한다는 개념이다.
최 상무는" 메타데이터가 관리돼야 하고 데이터 카탈로그를 잘 만드는 과정이 필요하다"며 "데이터가 어디에 있는지 알 수 있는 환경과 데이터 리니지(계보)를 확인하는 맵(map)도 볼 수 있어야 한다"고 했다. 이어 "그래야만 데이터 분석가가 양질의 데이터인지 여부를 판단할 수 있다"고 덧붙였다.
아울러 데이터 거버넌스를 만든 후 기능을 향상하는 과정에 AI 기술이 도움이 될 수 있다고도 했다. 누락된 데이터를 AI가 보완해 문맥에 맞게 데이터 내용을 자동 생성해줄 수 있다는 것이다. AI 기술은 데이터 테이블이나 레이블을 확인했을 때 잘 모르는 데이터에 대한 가이드를 제공할 수도 있다.
최 상무는 최근 증가한 '비정형 데이터'를 분석하고자 하는 니즈도 만족시킬 수 있다고 내다봤다. 예컨대 IBM은 문서를 자동으로 벡터라이징하는 기능 등을 데모로 제공하고 있다. 벡터라이징은 이미지나 글자를 '수학적인 선과 도형'으로 바꾸는 작업으로, 문서를 데이터화하는 작업으로 볼 수 있다.
최 상무는 "앞으로는 AI가 들어가지 않은 업무는 없을 것"이라며 "수많은 기업이 AI에 매우 많은 투자를 하고 있고 이를 내재화하기 위해 인력들을 고용하면서 품귀현상까지 일어나고 있다"고 했다. 그러면서 "많은 고객사에 AI 활용하기 전에 '데이터부터 정비하라'고 말씀드린다"며 다시 한번 양질 데이터의 중요성을 강조했다.