Search

'구글 어시스턴트 이중언어'에 해당되는 글 1건

  1. 2018.09.21 다인종·다문화 시대 AI 가전의 필수 기능이 될 이중언어 지원

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1864호(2018. 9. 19. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

다인종·다문화 시대 AI 가전의 필수 기능이 될 이중언어 지원.pdf



[ 요 약 ]


구글이 자사 인공지능 가상비서 구글 어시스턴트에 이중언어 지원 기능을 추가하였음. 구글 어시스턴트는 이미 30개에 가까운 언어를 지원 중이나 다른 언어로 이용할 경우 설정을 변경해야 했는데, 이중언어 지원으로 설정 변경없이 동시에 2개 언어로 사용이 가능하게 되었음. 이중언어 지원은 미국 내 다국어 사용 가족이 늘어나며 필요해진 기능인데, 향후 AI 스피커, AI 가전은 물론 스마트홈에서 다중언어 지원은 필수 기능이 될 것으로 전망



[ 본 문 ]


구글은 지난 8월 말 자사의 인공지능 가상비서 구글 어시스턴트(Google Assistant)’이중언어(bi-lingual)’를 지원할 수 있게 되었다고 발표


지금까지는 구글 어시스턴트를 하나의 언어로만 사용할 수 있었지만, 이제는 동시에 두 개 언어로 이용할 수 있게 되었다는 것으로, 가령 영어로 말을 걸면 영어로, 이탈리아어로 질문하면 이탈리아어로 즉각 대답을 해준다고 함


<자료> Google

[그림 1] AI 스피커 구글 홈의 이중언어 지원


구글 어시스턴트는 연내에 30개 언어를 지원할 예정으로 지금도 계속 지원 언어를 늘려가고 있는데, 현재 구글 어시스턴트가 탑재된 가전이나 스마트폰을 이용하려면 설정에서 원하는 언어 한 가지를 선택해야 함


이번 이중언어 지원은 디바이스 설정 메뉴에서 이용 언어를 두 개선택할 수 있게 되었다는 것이며, 이용자는 영어, 독일어, 프랑스어, 스페인어, 이탈리아어, 일본어6개 언어에서 두 개를 동시에 활성화시킬 수 있음


가정 보급이 확산되고 있는 인공지능(AI) 스피커 등에서 이중언어를 구사하는 것은 매우 어려운 과제로 알려졌는데, 구글이 이 문제를 처음으로 해결한 것임


구글은 조만간 더 많은 언어를 이중언어 지원 기능에 포함시킬 것이며, 현재 3개 국어를 동시에 지원하는 기능도 개발 중이라고 밝혔음



구글이 이중언어 지원 기능을 개발한 이유는 AI 가전이 점차 스마트홈의 허브로 자리잡아가는 가운데, 미국은 물론 전세계적으로 다국어 가족이 늘어나고 있기 때문


미국에서는 전체 가구의 20% 이상이 이중언어 가족이라고 하며, 실리콘밸리가 있는 캘리포니아주의 경우 무려 50% 이상이 이중언어 가족이라고 함


이중언어 가족은 통상 집에서 두 개의 모국어를 혼용하여 사용한다고 하는데, 가령 미국은 예로부터 멕시코로부터 이주가 많았기 때문에 집에서 영어 외에 스페인어를 같이 사용하는 가정이 많다고 함


이런 이중언어 환경은 AI 스피커를 판매하는 아마존이나 구글에 새로운 숙제를 안겨주게 되는데, 가족들 모두가 두 개의 언어를 완벽히 구사한다면 모르겠지만 그렇지 않은 경우 AI 스피커의 효용은 줄어들기 때문


따라서 에코(Echo)나 구글 홈(Google Home) 같은 AI 스피커가 스마트홈의 허브로까지 사용될 만큼 인기와 호응을 얻어갈수록, 음성비서를 개발하는 업체들에게 이중언어 지원 기능은 차별화 기능, 나아가 필수 기능으로 느껴졌을 것임


이제 구글이 처음으로 음성비서에 이중언어 기능을 지원하고 나섬에 따라, 아마존이나 애플 역시 조만간 이중언어 기능을 내놓아야 하는 압박을 받게 되었음



<자료> Android Police

[그림 2] 구글 어시스턴트에서 영어프랑스어 동시 설정으로 2개 국어 동시 이용


구글 어시스턴트의 이중언어 처리를 위해선 두 가지 어려운 과제를 해결해야 했는데, 지시된 음성 언어를 식별하는 것과 실시간으로 지시 내용을 파악해 액션을 취하는 것임


구글은 구어(회화체 언어) 식별 기술을 2013년부터 개발해 왔는데, 이 기술은 ‘Language Identification(LangID)’라 불리며, 구어를 전처리하고 이를 순환신경망(Recurrent Neural Network, RNN)에 입력하여 신경망에서 언어의 종류를 추정하는 것임


가령 [그림 3]에서 ‘hey thank you for calling me’라는 구어를 LandID에 입력하면 신경망은 8개 국어 중 어떤 언어로 말을 했는지 추정하는데, 신경망은 프레임마다 추정 처리를 계속하게 되며, 이 경우는 '영어'를 말한 것으로 추정하였음

 

<자료Ignacio López Moreno

[그림 3] 순환신경망(RNN)을 이용한 언어 시별 기술 LangID


LangID에서 언어를 식별하고 나면 구글 어시스턴트는 다음으로 그 말의 의미를 파악하고 지시된 작업을 수행하는데, 이 과정은 대량의 컴퓨팅 연산이 필요하기 때문에 이를 실시간으로 수행하기가 매우 어려움


따라서 구글은 두 개의 언어 처리를 병렬로 실행해 두고, 언어 판정 결과가 나오면 그 해당 언어의 처리만을 실행하는 방식을 채택하였음


구체적으로 살펴보면 두 쌍의 LangID 처리와 언어 해석을 병렬로 실행시키고, 그 결과를 순위 알고리즘(Ranking Algorithm)으로 평가한 다음, 어떤 언어로 말했는지를 판정함


언어를 식별하고 나면 해당 언어만 처리하고 다른 처리작업은 중단하는데, 해당 언어의 처리는 이미 진행되고 있는 중이며, 이런 방법으로 실시간 대응이 가능하게 된 것임


구글은 아마존 에코의 아이디어를 빌려 AI 스피커 시장에 진입했으나, 기술력으로 시장 선두를 차지했으며 이번 이중언어 지원 기능으로 입지를 더욱 강화하게 될 전망


구글은 에코를 본떠 구글 홈을 개발했으나, 이후 앞선 AI 기술을 무기로 구글 홈의 매출을 늘려왔으며 마침내 판세를 역전해 최근 아마존을 앞서기 시작하였음


구글이 아마존을 빠른 시간 내에 앞설 수 있었던 가장 큰 이유는 전세계 안드로이드폰 사용자들을 지원하기 위해 이미 수많은 현지 언어 모델을 구축해 왔고, 이를 기반으로 에코보다 더 빠르게 구글 홈을 외국 시장에 출시할 수 있었기 때문임


20187월말 현재 아마존 에코가 11개국에서 판매되고 있고, 애플의 홈팟(HomePod)6개국에서 판매되는 것에 비해, 구글 홈은 14개국에서 판매되고 있음


시장조사기관 커낼리스(Canalys)에 따르면 20182분기 전세계 AI 스피커 시장에서 구글 홈은 출하량 540만 대로 1위를 차지했으며, 아마존 에코는 410만 대에 그쳤음


그 뒤로는 알리바바와 샤오미 등 중국 기업들의 제품이 빠르게 시장 점유율을 늘리고 있는 것으로 나타났는데, AI 스피커 시장에서 구글이 선두를 차지하기는 했지만 앞으로는 아마존보다 중국 기업과 더 치열한 경쟁을 할 것이란 분석도 나오고 있음


구글이 사람과 거의 흡사한 목소리로 레스토랑이나 미용실 예약을 대신할 수 있는 구글 듀플렉스를 내놓는 등 음성인식 및 합성 기술에 엄청난 투자를 하고 있기는 하지만, 중국기업들 역시 AI 관련 연구개발 투자에는 돈을 아끼지 않고 있기 때문


[1] 20182분기 전세계 스마트 스피커 벤더별 시장점유율 순위

순위

벤더

20172분기

20182분기

전년 동기 대비 성장률

1

구글

16.9%

32.3%

449%

2

아마존

82.3%

24.5%

-14%

3

알리바바

-

17.7%

N/A

4

샤오미

-

12.2%

N/A

기타

0.8%

13.2%

> 4,000%

전체 출하대수

580만 대

1,680만 대

187%

<자료> Canalys, 2018. 8

 


이처럼 가상 비서가 이중언어를 넘어 더 많은 다중언어를 지원할 수 있다면 응용분야가 폭넓어질 것인데, 대표적 분야는 다국어 지원 안내 로봇 등 로보틱스 분야임


구글은 이미 이중언어 다음으로 삼중언어 지원 기능을 개발 중이라 밝혔는데, 이런 식으로 동시 지원 언어를 순차적으로 늘려간다면, 궁극적으로 세계의 주요 언어 대부분을 커버하게 될 수도 있음


, 구글 어시스턴트의 언어 제약이 없어지면서, 설정에서 특별히 언어를 선택할 필요도 없이 어떤 언어로 말을 걸더라도 그에 맞게 대응하도록 진화할 수도 있음


이렇게 되면 다국어 지원 기능의 응용 분야는 폭이 넓어 언어 장벽이 전혀 문제가 되지 않는 새로운 서비스들의 출현이 가능해질 것이며, 특히 로봇의 상호작용 능력을 크게 높일 것으로 기대됨


가령 관광 안내 로봇의 활용가치가 더 높아질 것인데, 최근 관광 안내 로봇이 많이 등장하면서 관광객들이 상호작용을 통해 정보를 얻을 수 있게 되었지만, 이 과정에서 먼저 대화 언어를 입력할 필요가 있음


만일 안내 로봇에 LangID 기법을 적용하게 되면, 안내 로봇에 갑자기 말을 걸어도 AI가 언어의 종류를 파악하고 질문을 받은 언어로 안내를 할 수 있게 되는데, 이는 국제 스포츠 대회나 학술 대회, 대규모 전시회 등에서 큰 효과를 발휘할 수 있을 것임


<자료전자신문

[그림 4] 평창 동계올림픽의 다국어 안내 로봇


한편 AI 음성비서의 다중언어 지원 흐름에 따라 국내 시장만 보고 있는 한국 업체들도 다국어 지원 경쟁에 보다 적극적으로 대비해야 할 것으로 보임


구글, 애플, 아마존, 알리바바 등 내로라하는 글로벌 기업들이 가상 비서의 이중언어 지원 기술을 경쟁적으로 강화해 나간다면, 향후 AI 스피커와 AI 가전에서 이중언어 지원은 필수 기능으로 올라설 가능성이 있음


그렇게 되면 국내 소비자들은 선택의 폭이 넓어지게 되는데, 자신의 필요에 따라 한국어를 완벽히 지원하는 국내 AI 가전과 다중언어 지원이 되는 외국 AI 가전 중 보다 효용성이 있는 것을 고를 수 있을 것임


반면 이런 상황은 국내 AI 스피커 및 스마트 가전업체들에게 큰 위협요인이 될 것인데, 다국어를 사용하는 가족의 비중은 그리 크지 않지만, 영어, 중국어, 일어 등 외국어 학습 열기가 높아 자녀교육 및 자기계발 목적으로 외국제품을 구매할 가능성이 있기 때문


따라서 AI 음성비서 기반 가전을 개발하는 국내업체들은 내수 시장만 겨냥한다 하더라도 이제 이중언어 및 다중언어 지원을 위한 연구개발에 보다 적극적으로 나설 필요가 있음


업체들의 이런 대응이 필요한 것은 현재 우리나라 사회의 인구 구조가 급변하고 있고, 저출산에 따른 인구절벽 때문에 외국인 이민의 적극 수용 주장도 나오고 있어, 향후 다중언어 환경이 필요한 가구 수가 크게 늘어날 수 있기 때문


아직은 배타적 성격이 강한 우리나라 사회의 특성상 외국인 이주 허용 확대는 단시간에 이루어지지 않겠지만, 사회의 변화 속도가 예상보다 빠르다는 점을 고려하면 한발 앞선 대응에 나설 필요가 있을 것임