Article

"언택트 시대, AI가 대리인"

[2020 키플랫폼-키맨 인터뷰]

김상희 조철희 | 2020.04.20 13:30

image
케이티 맥마흔 사운드하운드 부대표가 머니투데이와 인터뷰하고 있다./사진=김상희 기자
4차 산업혁명과 디지털 경제 시대의 핵심 기술인 AI(인공지능)가 코로나19(COVID-19) 대유행에 그 중요성이 더욱 부각되고 있다. 비대면·비접촉(언택트·untact) 산업의 성장 전망 속에서 AI의 혁신적 역할이 주목된다.

AI를 탑재한 로봇이 공항이나 호텔 등에서 길을 안내하거나 체크인 등의 업무를 도와주는데 사실상 인간의 대리인 역할을 하고 있는 셈이다.

팬데믹 팬더모니엄 이후(포스트 팬더모니엄) 새롭게 펼쳐질 미래상과 한국 기업들의 대응 전략·솔루션들을 제시할 머니투데이 2020 키플랫폼(K.E.Y PLATFORM 2020)이 AI 관련 기술 중 음성 인식 분야를 선도하고 있는 사운드하운드(SoundHound)의 케이티 맥마흔 부대표를 만나 포스트 팬더모니엄 시대 더욱 주목받을 AI 기술에 대해 들어봤다.

다음은 일문일답.

-AI가 세상을 어떻게 바꿀 것으로 생각하나.
▶AI 기술이 지금보다도 더 크게 삶의 변화를 가져올 것이다. 지금까지는 AI 기계를 이용할 때 주로 자연스러운 말이 아니라 단지 작동이 가능하도록 하는 명령을 했다. 하지만 사운드하운드의 기술을 예로 들면 무료 주차가 되는 곳만 알려 달라거나 아동 친화적인 곳, 야외 테이블이 있는 곳을 평점 순서대로 알려달라고 하는 등 AI와 대화를 주고받으며 답을 얻을 수 있다. 이러한 기능의 기반 기술은 매우 복잡하지만 이미 AI는 미래를 바꿀 무엇인가를 만들어 가고 있는 중이다.

-사운드하운드만의 차별화된 강점은 무엇인가.
▶음성을 바로 의미로 전환하는 기술(speech to meaning)이다. 이 기술은 자동음성인식과 자연어 이해가 동시에 이뤄진다. 다수의 AI는 음성 인식 기술(ASR)을 이용한다. 예를 들어 '지금 서울은 몇 시지?'라는 질문을 하면 음성이 엔진에 들어가 처리된 후 결과가 나온다. 그래서 속도가 느리고 오류가 발생할 수 있다. 사운드하운드의 AI는 음성을 바로 의미로 전환하는 기술과 함께 핵심 의미를 파악하는 기술(deep meaning understanding)을 통해 많은 양의 복잡한 데이터를 기반으로 질의에 답할 수 있다.

-AI는 다양한 상황에 대한 판단을 위한 정보를 어떻게 얻나.
▶정확한 정보를 얻는 방법 중 하나로 실시간으로 파트너사의 API(응용프로그램 인터페이스)를 이용한다. 집단 AI(collective AI)라는 훌륭한 기술이 있다. 우버, 옐프, 익스피디아 등을 AI 플랫폼에 포함시켜 스마트하게 일을 할 수 있다.

-AI 생태계는 어떻게 발전할 것으로 보는가.
▶스마트폰이 등장하며 운영체제로 안드로이드와 iOS가 나왔을 때 플랫폼들이 여러 개발 도구를 공개해 우리가 사는 세상 전체가 바뀌었다. 터치 인터페이스, 그래픽 인터페이스, 마이크를 이용해 다양한 기업과 브랜드들이 글로벌 시장에 진출하고, 혁신을 통해 성장했다. 어떤 개발자들은 불과 한 달 만에 백만장자가 되기도 했다.

-사운드하운드 기술은 AI 생태계에서 어떤 역할을 하나.
▶음성 기술이 어려운 이유는 여러 다양한 과학적 배경이 필요하고 동시에 상이한 엔지니어링 문제점들과 관련돼 있기 때문이다. 그중 한 가지는 비주얼(시각화) 인터페이스가 제공되지 않는 경우가 많다는 점이다. 대신 VUI(Voice User Interface·음성 사용자 인터페이스)가 이용되는데, 이것은 비주얼 인터페이스와 완전히 다른 분야다. 핵심 기술이 다르다. 이 분야는 매우 어렵기 때문에 개발자를 위한 지원과 도구가 필요하다. 사운드하운드 플랫폼은 스마트하게 구축돼 많은 이들이 이용할 수 있는 도구를 제공한다.