※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1830호(2018. 1. 24. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

‘아직 집에 대해 잘 모른다’, 구글이 말하는 스마트 스피커의 과제.pdf



ž 구글은 올해 CES에서 최초로 자사의 부스를 마련했는데, 스마트 시티와 자율주행차가 테마였던 2018 CES에 구글이 내세운 제품은 인공지능(AI) 기반 스마트 스피커였음


<자료> 9to5 Google


[그림 1] 2018 CES를 뒤덮은 구글의 광고


Ø 구글은 라스베이거스 시내와 CES 행사장인 라스베이거스 컨벤션센터(LVCC)를 오가는 모노레일의 외관과 도심 곳곳의 전광판을 구글의 AI 음성 비서인 구글 어시스턴트를 호출할 때 쓰는 말인 헤이 구글(Hey Google)로 뒤덮었음


Ø 이는 구글이 이번 CES에 부스를 차린 목적이 AI 기반 스마트 스피커를 홍보하고, 스마트 스피커 시장 점유율 67%를 차지하는 아마존에 도전장을 내밀기 위한 것임을 보여 줌


Ø 구글이 작년 10월 출시한 AI 스피커 제품 구글홈 미니(Google Home Mini) 모델은 1월 첫 주까지 총 673만 대 출하되었는데, 이는 11월 말 추수감사절 이후 구글홈 미니 가격을 49달러에서 29달러로 내림에 따라 수요가 급증했기 때문


Ø 이와 동시에 12월에는 프리미엄 스마트 스피커를 표방한 구글홈 맥스(Max) 모델을 399달러에 내놨는데, 구글홈 맥스는 식기세척기가 돌아가면 자동으로 볼륨을 높이는 등 주변 환경에 따라 스스로 음량과 음색을 바꾸는 기능을 탑재하고 있음


ž 구글의 스마트 홈 제품 책임자인 마크 스페이츠는 CES의 토크 세션에 참여해 구글 어시스턴트와 스마트 스피커의 과거와 현재, 그리고 미래에 대한 의견을 밝혔음


Ø 토크 세션의 제목은 음성 제어: 스마트 홈 경험의 개선이었는데, 이 토론에는 인텔의 스마트 홈 그룹 제네럴 매니저인 마일즈 킹스턴, 삼성전자의 서비스 및 신규사업 부사장이나 제너럴 매니저인 나나 무루게산 등이 함께 패널로 참석하였음


Ø 스페이츠는 스마트 스피커인 구글홈을 개발하기 위해 우선 집을 아는 것에서부터 시작했다고 말했는데, 스마트 스피커에 무슨 일을 시킬 것인지가 아니라 무슨 기능이 필요한 지를 생각했을 때 개발팀 중 아무도 에 대해 제대로 아는 사람이 없다는 것을 깨닫게 되었다고 함


Ø 스페이츠는 스마트 스피커가 아직 완성도가 높은 제품이 아니라고 평가했는데, 토론에 참여한 다른 패널들도 아마존닷컴에 이어 구글 등이 잇따라 스마트 스피커를 출시하고 있지만 이 시장은 아직 초기단계라는 점을 강조하였음.


Ø 삼성전자의 무루게산 부사장은 스피커가 이해력(intelligent)은 있지만 경험에 기반한 현명함(wise)이 있지는 않다며, 현명해지기 위해서는 인간과 더 많은 관계가 필요하다고 말했음


Ø 스마트 스피커와 대화의 시작을 위해 헤이 구글'과 같은 말을 사용하지 않으면 안 되는 것도 아직 어색한 지점이라는 지적도 있었음


ž 패널들 중에는 스마트 스피커가 향후 디스플레이와 조합에 의해 더 발전해 나갈 것이라는 의견을 제시한 사람이 많았음



Ø 실제 올해 CES에서는 스마트 디스플레이 관련 기술에 대한 관심이 높았는데, 소니, 삼성전자 산하의 JBL, LG전자, 레노버 등이 구글 어시스턴트를 지원하는 제품을 발표하였음


Ø 스페이츠 역시 스마트 스피커를 주방에 두는 경우를 예로 들며, 음성으로 타이머 기능을 이용하는 것은 좋지만 스피커가 레시피를 음성으로 읽어 주는 방식은 좀 곤란하다고 지적


Ø 캘린더 기능에 대해서도, 오늘의 날씨 정도를 듣는 것은 상관 없지만, 스피커가 읽어 주는 모든 일정의 내용을 듣고 있는 것은 고역이라며, 구글 어시스턴트와 디스플레이의 조합을 통해 편의성이 개선될 수 있을 것으로 전망했음


<자료> Digital Trends


[그림 2] 레노버의 스마트 디스플레이


ž 마크 스페이츠가 향후 스마트 스피커의 과제로 제시한 것은 대화 기능다양한 가족 구성원들이 익숙하게 사용하기


Ø 대화란 어떤 질문에 대해 답하고 그 대답에 반응하여 이야기가 이어지는 것인데, 이런 의미에서 스마트 스피커는 아직 대화를 할 수 있는 수준은 아니라는 게 스페이츠의 의견이며, 질문을 할 경우에만 응답하는 방식의 일방통행적 커뮤니케이션은 아직 대화가 아니라는 평


Ø 또 다른 과제로는, 세대와 관심 범위, 기술에 대한 이해도가 각기 다른 가족 구성원들이 어떻게 스마트 스피커 사용에 익숙하게 할 수 있는가를 꼽았음


Ø 스페이츠는 어떤 활용 예(Use Case)를 상상하느냐에 달려 있다고 말하며 두 가지 예를 언급했는데, 첫번째는 구글이 실시한 프로모션 사례로, 오케이 구글, 크리스마스 트리에 불을 켜라고 명령하는 동영상 광고를 내보내자 많은 사람들이 방법을 배워 그대로 따라 했다고 함



Ø 이는 어떤 활용 예가 있을 수 있는지 상상해 보고 실제로 보여주는 것이 중요함을 보여주는데, 상상할 수 있으려면 에 대해 더 깊이 아는 것이 중요하다고 스페이츠는 지적함


Ø 집에 대해 잘 알아야 어떤 상황에 스마트 스피커를 사용하는 것이 좋은 활용사례가 될 수 있는지를 이해할 수 있기 때문인데, 올바른 방법으로 올바른 타이밍에 음성 UI를 사용할 수 있게 된다면 스마트 스피커는 다음 단계로 올라설 수 있을 것임


Ø 또 다른 예로는, 나이 드신 어머니와 연락이 되지 않아 무슨 일이 벌어졌는지 걱정한 이후로 모든 방에 구글홈을 설치한 사람의 사례를 들었음


Ø 이 사람은 어머니에게 어느 방에서도 노래를 들을 수 있게 하려 그런다는 식으로 설명했으며, 구글홈의 설정에 뭔가 수정이 발생하면 바로 자신에게 연락이 오도록 해두었다고 함


Ø 스페이츠는 아무도 스마트 하우스를 샀다!’는 식으로 말하지 않는다며, 소비자들이 자신의 집에 기술을 접목함으로써 얼마나 편리하게 되는가를 자연스럽게 이해할 수 있도록 하는 것이 향후 스마트 스피커 시장 확대에 기여할 것이라 강조했음

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1818호(2017. 10. 18. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

구글 하드웨어 신제품 발표, 제품 차별화 요소는 &lsquo;AI 최적화&rsquo;.pdf



[ 요 약 ]


구글이 작년에 이어 메이드 바이 구글(Made by Google) 행사를 통해 신제품을 대거 공개했는데올해 신제품 발표회의 테마는 하드웨어와 소프트웨어그 중에서도 인공지능(AI)의 통합이었음구글은 이번 신제품에 최신 AI 기술의 성과를 광범위하게 적용하며향후 AI가 기기 차별화의 결정적 요인이 될 것으로 바라보고 있음을 드러냈음스마트 기기의 하드웨어 차별성이 점차 엷어지는 가운데소프트웨어 최적화를 넘어선 AI 최적화가 제품 경쟁의 새로운 화두가 될 것으로 예상됨



[ 본 문 ]


ž 작년 10메이드 바이 구글(Made by Google) 하드웨어 신제품 5개를 일거에 출시했던 구글이 1년 만에 다시 신제품을 대거 발표하였음


Ø 이번에 발표한 신제품은 작년에 출시된 제품의 업그레이드 버전도 있지만, 구글로서는 새롭게 시도하는 제품들도 포함되어 있음


<자료> Google

[그림 1] Made by Google 2017


Ø 작년에 선보인 구글 자체 스마트폰 픽셀(Pixel)의 후속 버전으로 픽셀 2가 발표됐으며, 역시 작년에 선보인 인공지능(AI) 스피커 구글 홈(Google Home)은 이번에 구글홈 미니(Mini)구글홈 맥스(max)로 라인업이 확대되었음


Ø 올해 새롭게 선보인 제품으로는 액션 카메라인 구글 클립스(Google Clips)와 음악 재생 및 외국어 번역에 사용하는 블루투스 헤드셋 구글 픽셀 버즈(Google Pixel Buds), 그리고 크롬북의 상위 버전이라 할 수 있는 노트북 픽셀북(PIxelbook)이 있음


Ø 작년 10월에 이어 1년 만에 다시 하드웨어 발표회를 개최함으로써 향후 구글이 5월에 개최되는 연례 개발자 컨퍼런스 구글 I/O에 이어 10월의 신제품 발표회를 연례 행사화 할 가능성도 점쳐지고 있음


ž 이번 신제품 발표회의 테마는 하드웨어에 소프트웨어와 인공지능(AI)을 통합하는 것으로, 구글이 AI를 제품 차별화의 결정적 요인으로 바라보고 있음을 드러냄


Ø 구글홈 미니는 아마존의 소형 AI 스피커인 에코닷(Echo Dot)의 대항마 성격으로, 가격은 49 달러이지만 AI 가상비서 기능인 구글 어시스턴트(Google Assistant)가 탑재되어 있음


Ø 미니는 도넛 크기의 타원형 형상으로 상단에 LED가 탑재되어 기기 상태를 표시해주는데, 에코닷과 마찬가지로 가정 내 각 방에 하나씩 놓고 사용하는 것을 전제로 디자인 한 것으로 보이며, 구글이 집 전체 공간을 AI로 채우고 싶어함을 유추할 수 있음


Ø 맥스는 음질을 중요한 모델인 동시에 구글이 400 달러인 가격에 걸맞게 구글홈보다 20배 정도 성능이 강력하다고 소개할 정도로 AI 기반의 사운드 재생 기능이 뛰어난 기기임


Ø 2개의 4.5인치 우퍼를 내장해 깊이 있는 사운드 재생이 가능하며, 스마트 사운드(Smart Sound) 기능을 탑재하고 있어 주변 환경과 사용자의 컨텍스트에 맞게 음악을 재생할 수 있음



<자료> Google


[그림 2] 구글홈 미니(Mini)와 맥스(Max)


Ø 구글은 스마트 사운드 기능의 예로 AI가 방의 모양을 파악해 그에 적합한 사운드를 재생하거나, 아침 시간에는 볼륨을 좀 낮추어 재생하고 식기 세척기가 가동 중이어서 시끄러울 때는 볼륨을 높여 음악을 재생하는 것 등이 가능하다고 설명하고 있음


Ø 픽셀 2 스마트폰에는 지난 5월 구글 I/O에서 소개한 구글 렌즈(Google Lens) 기능이 처음으로 적용되었는데, 구글 렌즈는 구글 어시스턴트를 기반으로 렌즈에 비친 사물에 대한 정보를 불러들인 후 사진에 담긴 물체나 글자를 인식해 알려주는 AI 카메라임


Ø 픽셀북은 노트북과 태블릿 PC를 결합한 것으로 역시 구글 어시스턴트가 적용되어 있으며, 가령 픽셀북 펜을 이용해 디스플레이 화면 안의 특정 부분에 원을 그리면 구글 검색 엔진이 그 원안의 물체를 인식하고 관련된 정보를 검색해 줌


ž 구글이 AI를 신제품의 차별화 요소로 삼는 이유는, AI가 비단 구글의 하드웨어 신제품뿐 아니라 스마트 홈 생태계의 허브 기능을 담당할 것으로 보기 때문임


Ø 구글홈의 핵심 기능인 구글 어시스턴트는 스마트폰(안드로이드와 iOS), 스마트 워치(안드로이드 웨어), 텔레비전(안드로이드 TV) 등과도 연계할 수 있으며, 가상 비서의 인터페이스는 급속하게 음성으로 전환하고 있음


Ø 구글 어시스턴트는 생태계를 급속히 확장하고 있는데, 현재 스마트 홈 관련 기업 네스트(Nest), 필립스(Philips), 스마트씽스(SmartThings) 등이 내놓은 1천여 제품과도 연계가 가능함


Ø 특히 알파벳 산하의 네스트와 구글홈의 연계가 더욱 강화되고 있는데, 이번 기능 업그레이드로 네스트의 보안 카메라인 네스트 캠(Nest Cam)을 구글홈에서 조작할 수 있게 되었음


<자료> Google


[그림 3] 구글홈과 네스트 캠의 연계


Ø 이로써 가령 현관에서 무슨 소리가 나는 것 같을 때 구글홈에게 현관 앞 상황을 TV로 보여줘라고 명령하면, 구글홈이 네스트 캠에 찍힌 영상을 TV로 디스플레이 하는 것이 가능해졌음


Ø 또한 네스트의 스마트 초인종인 네스트 헬로(Nest Hello)도 구글홈에서 조작할 수 있게 되었는데, 네스트 헬로는 얼굴 인식 기능으로 방문자를 식별할 수 있는 친숙한 얼굴(Familiar Faces)라는 기능을 탑재하고 있음


Ø 따라서 누군가 초인종을 누르면 네스트 헬로가 그 인물을 인식해 구글홈에 알려주고, 구글홈이 이용자에게 방문자의 이름을 알려주는 것이 가능하며, 이런 기능을 활용해 네스트와 연계한 주택의 보안을 구글홈에서 집중 관리하는 것이 가능함


Ø 구글 어시스턴트가 허브가 되는 스마트 홈은 개인화 서비스도 가능한데, 보이스 매치(Voice Match) 기능을 통해 동시에 여섯 명의 목소리를 구분해 알아 듣고 개별 대응이 가능하기 때문


Ø 개인 맞춤형 서비스의 예로 이번 신제품 발표회에서는 에브리데이 루틴(Everyday Routines) 기능이 소개되었는데, 이는 한 단어만 듣고 그 사람과 관련된 여러 가지 명령을 동시에 실행하는 것으로 구글의 지향점을 잘 보여주고 있음


Ø 가령 식구들 중 회사로 출근을 해야 하는 사람이 있을 경우, 이 사람이 아침에 일어나 좋은 아침이라고 한 마디만 하면, 구글홈이 그의 하루 일정을 확인하고 일정에 따른 이동 경로의 도로 정체 정보를 알려주며 주요 뉴스를 읽어주도록 설정할 수 있음


Ø 또한 아이들이 구글홈에게 우리 게임하자라고 말을 할 경우, 아이들의 목소리를 인식하여 아이들이 안전하게 즐길 수 있는 게임을 실행하도록 설정할 수도 있음


ž 구글은 AI가 스마트 홈의 허브로 선택될 수 있도록 인간 친화적인 특성을 띠게 하는 데도 공을 들였는데, 여기에는 딥마인드(DeepMind)의 새로운 음성합성 기술이 기여를 하였음


Ø 구글홈의 음성 발화는 고급 AI가 적용되어 매우 매끄럽게 들리는데, 여기에는 딥마인드가 지난해 발표한 새로운 음성 합성(Speech Synthesis) 기술이 관여되어 있음


Ø 딥마인드가 새롭게 발표한 웨이브넷(WaveNet)은 심층신경망(Deep Neural Network)을 이용해 기계음이 인간에 가깝게 자연스럽게 발성할 수 있게 해주는 음성 합성 기술임


Ø 일반적으로 음성 합성은 말을 아주 작은 단위로 나눈 다음 필요한 음운, 음소, 단어에 맞게 조립하는 음성 연결 합성(Concatenative TTS)이라는 기법 사용하는데, 이 때문에 기계음은 말 그대로 기계적이고 어색한 톤으로 발화가 됨


Ø 딥마인드는 기존의 방식과 전혀 다른 접근 방식을 취했는데, 웨이브넷은 많은 수의 음성 샘플을 배우고 음성 파형(Audio Waveform)을 잘게 세분화 해 분석함으로써 음성 만으로는 알 수 없었던 숨 고르기나 단어 혹은 문장끼리 합쳐지는 방식까지 이해가 가능하게 하였음


Ø 구체적으로 살펴 보면 컨볼루셔널 신경망(Convolutional Neural Network, CNN)이 발화의 구성을 파악하여 어떤 음색(Tone) 후에 어떤 음색이 이어지는지, 어떤 파형(Waveform)이 자연스러운지 학습하게 되며, 이를 토대로 아주 부드러운 음성을 합성하게 됨


Ø 딥마인드는 웨이브넷이 인간의 미묘한 톤이나 억양, 말할 때의 속도 등을 그대로 재현할 수 있다고 설명했는데, 음성 연결 합성 방식이나, 인간 음성 샘플 없이 기계가 음성을 생성하는 방식(Parametric TTS) 등 기존 기술과 블라인드 테스트를 한 결과 인간의 실제 음성에 육박하는 수준의 높은 점수로 1위를 차지했다고 함


Ø 단 작년 발표 시점에서 웨이브넷은 음성 합성을 빠르게 수행 할 수 없어 0.02 초의 오디오를 생성하는데 1 초가 필요했으나, 그 동안 알고리즘 개선을 통해 빠른 음성 합성까지 가능해졌다고 하며, 현재 1 초 길이 오디오를 50 밀리 초에 생성하므로 실시간 사용이 가능하다고 함


[1] 딥마인드 웨이브넷과 음성 합성 기술의 비교

 

Concatenative

Parametric

WaveNet

인간의 음성

미국식 영어

3.86

3.67

4.21

4.55

만다린 중국어

3.47

3.79

4.08

4.21

<자료> DeepMind


ž 하드웨어들의 주요 기능이 점차 천편일률적으로 되어 가는 상황에서, 이번 구글의 신제품 발표회는 향후 AI 최적화가 스마트 기기의 시장 성패를 가르게 될 것임을 강하게 시사


Ø 구글홈을 비롯해 이번에 구글이 발표한 제품들의 배후에는 최신 AI 기법이 광범위하게 사용되고 있는데, 이용자의 음성을 인식하는 데뿐만 아니라 음성 합성 역시 AI 없이는 매력적인 특색을 실현할 수 없음을 보여주고 있음


Ø 소프트에어 기업인 구글이 자체 하드웨어 생산에 나선 데에는 여러 가지 이유가 있겠으나, 하드웨어를 통한 차별화는 이제 한계에 다다르고 소프트웨어를 통한 차별화, 그 중에서도 AI에 의한 차별화가 제품 경쟁력의 핵심 요소가 될 것으로 판단했기 때문이라 볼 수 있음


Ø 가령 지금까지 스마트폰의 경쟁 구도는 애플의 소프트에어 최적화와 삼성전자의 하드웨어 고사양화로 요약할 수 있는데, 아이폰이 상대적으로 낮은 하드웨어 사양을 소프트웨어 최적화로 커버했다면, 갤럭시 폰은 소프트웨어의 단점을 하드웨어 혁신으로 커버하는 전략이었음


Ø 그러나 최근 들어 아이폰이나 갤럭시 폰을 비롯해 대부분의 스마트폰 사양들은 유사해지고 있는데, 구글은 이를 하드웨어 혁신의 속도가 둔화된 것, 즉 하드웨어 부문을 직접 관리하는 부담이 적어지는 신호로 받아들였을 가능성이 큼


Ø 따라서 보다 중요해지는 것은 애플과 같은 소프트웨어 최적화 역량인데, 구글은 안드로이드 OS와 하드웨어의 최적화에 덧붙여 AI 최적화를 무기로 하드웨어 비즈니스에 뛰어들려는 것으로 해석할 수 있음


Ø 하드웨어 경쟁력보다 소프트웨어 경쟁력이 압도적 이윤을 가져다 줄 수 있다는 점은 이미 애플과 삼성전자의 경쟁에서 확인된 바 있거니와, 구글은 이에 더해 AI가 제품의 차별화와 이윤을 가져다 줄 것이라 주장하는 것임


Ø 구글이 던진 AI 최적화의 화두는 스마트 디바이스 시장의 경쟁 지형을 새롭게 재편할 가능성이 크며, 디바이스 제조업체들 앞에 쉽지 않은 숙제가 던져진 셈