※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1830호(2018. 1. 24. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

‘아직 집에 대해 잘 모른다’, 구글이 말하는 스마트 스피커의 과제.pdf



ž 구글은 올해 CES에서 최초로 자사의 부스를 마련했는데, 스마트 시티와 자율주행차가 테마였던 2018 CES에 구글이 내세운 제품은 인공지능(AI) 기반 스마트 스피커였음


<자료> 9to5 Google


[그림 1] 2018 CES를 뒤덮은 구글의 광고


Ø 구글은 라스베이거스 시내와 CES 행사장인 라스베이거스 컨벤션센터(LVCC)를 오가는 모노레일의 외관과 도심 곳곳의 전광판을 구글의 AI 음성 비서인 구글 어시스턴트를 호출할 때 쓰는 말인 헤이 구글(Hey Google)로 뒤덮었음


Ø 이는 구글이 이번 CES에 부스를 차린 목적이 AI 기반 스마트 스피커를 홍보하고, 스마트 스피커 시장 점유율 67%를 차지하는 아마존에 도전장을 내밀기 위한 것임을 보여 줌


Ø 구글이 작년 10월 출시한 AI 스피커 제품 구글홈 미니(Google Home Mini) 모델은 1월 첫 주까지 총 673만 대 출하되었는데, 이는 11월 말 추수감사절 이후 구글홈 미니 가격을 49달러에서 29달러로 내림에 따라 수요가 급증했기 때문


Ø 이와 동시에 12월에는 프리미엄 스마트 스피커를 표방한 구글홈 맥스(Max) 모델을 399달러에 내놨는데, 구글홈 맥스는 식기세척기가 돌아가면 자동으로 볼륨을 높이는 등 주변 환경에 따라 스스로 음량과 음색을 바꾸는 기능을 탑재하고 있음


ž 구글의 스마트 홈 제품 책임자인 마크 스페이츠는 CES의 토크 세션에 참여해 구글 어시스턴트와 스마트 스피커의 과거와 현재, 그리고 미래에 대한 의견을 밝혔음


Ø 토크 세션의 제목은 음성 제어: 스마트 홈 경험의 개선이었는데, 이 토론에는 인텔의 스마트 홈 그룹 제네럴 매니저인 마일즈 킹스턴, 삼성전자의 서비스 및 신규사업 부사장이나 제너럴 매니저인 나나 무루게산 등이 함께 패널로 참석하였음


Ø 스페이츠는 스마트 스피커인 구글홈을 개발하기 위해 우선 집을 아는 것에서부터 시작했다고 말했는데, 스마트 스피커에 무슨 일을 시킬 것인지가 아니라 무슨 기능이 필요한 지를 생각했을 때 개발팀 중 아무도 에 대해 제대로 아는 사람이 없다는 것을 깨닫게 되었다고 함


Ø 스페이츠는 스마트 스피커가 아직 완성도가 높은 제품이 아니라고 평가했는데, 토론에 참여한 다른 패널들도 아마존닷컴에 이어 구글 등이 잇따라 스마트 스피커를 출시하고 있지만 이 시장은 아직 초기단계라는 점을 강조하였음.


Ø 삼성전자의 무루게산 부사장은 스피커가 이해력(intelligent)은 있지만 경험에 기반한 현명함(wise)이 있지는 않다며, 현명해지기 위해서는 인간과 더 많은 관계가 필요하다고 말했음


Ø 스마트 스피커와 대화의 시작을 위해 헤이 구글'과 같은 말을 사용하지 않으면 안 되는 것도 아직 어색한 지점이라는 지적도 있었음


ž 패널들 중에는 스마트 스피커가 향후 디스플레이와 조합에 의해 더 발전해 나갈 것이라는 의견을 제시한 사람이 많았음



Ø 실제 올해 CES에서는 스마트 디스플레이 관련 기술에 대한 관심이 높았는데, 소니, 삼성전자 산하의 JBL, LG전자, 레노버 등이 구글 어시스턴트를 지원하는 제품을 발표하였음


Ø 스페이츠 역시 스마트 스피커를 주방에 두는 경우를 예로 들며, 음성으로 타이머 기능을 이용하는 것은 좋지만 스피커가 레시피를 음성으로 읽어 주는 방식은 좀 곤란하다고 지적


Ø 캘린더 기능에 대해서도, 오늘의 날씨 정도를 듣는 것은 상관 없지만, 스피커가 읽어 주는 모든 일정의 내용을 듣고 있는 것은 고역이라며, 구글 어시스턴트와 디스플레이의 조합을 통해 편의성이 개선될 수 있을 것으로 전망했음


<자료> Digital Trends


[그림 2] 레노버의 스마트 디스플레이


ž 마크 스페이츠가 향후 스마트 스피커의 과제로 제시한 것은 대화 기능다양한 가족 구성원들이 익숙하게 사용하기


Ø 대화란 어떤 질문에 대해 답하고 그 대답에 반응하여 이야기가 이어지는 것인데, 이런 의미에서 스마트 스피커는 아직 대화를 할 수 있는 수준은 아니라는 게 스페이츠의 의견이며, 질문을 할 경우에만 응답하는 방식의 일방통행적 커뮤니케이션은 아직 대화가 아니라는 평


Ø 또 다른 과제로는, 세대와 관심 범위, 기술에 대한 이해도가 각기 다른 가족 구성원들이 어떻게 스마트 스피커 사용에 익숙하게 할 수 있는가를 꼽았음


Ø 스페이츠는 어떤 활용 예(Use Case)를 상상하느냐에 달려 있다고 말하며 두 가지 예를 언급했는데, 첫번째는 구글이 실시한 프로모션 사례로, 오케이 구글, 크리스마스 트리에 불을 켜라고 명령하는 동영상 광고를 내보내자 많은 사람들이 방법을 배워 그대로 따라 했다고 함



Ø 이는 어떤 활용 예가 있을 수 있는지 상상해 보고 실제로 보여주는 것이 중요함을 보여주는데, 상상할 수 있으려면 에 대해 더 깊이 아는 것이 중요하다고 스페이츠는 지적함


Ø 집에 대해 잘 알아야 어떤 상황에 스마트 스피커를 사용하는 것이 좋은 활용사례가 될 수 있는지를 이해할 수 있기 때문인데, 올바른 방법으로 올바른 타이밍에 음성 UI를 사용할 수 있게 된다면 스마트 스피커는 다음 단계로 올라설 수 있을 것임


Ø 또 다른 예로는, 나이 드신 어머니와 연락이 되지 않아 무슨 일이 벌어졌는지 걱정한 이후로 모든 방에 구글홈을 설치한 사람의 사례를 들었음


Ø 이 사람은 어머니에게 어느 방에서도 노래를 들을 수 있게 하려 그런다는 식으로 설명했으며, 구글홈의 설정에 뭔가 수정이 발생하면 바로 자신에게 연락이 오도록 해두었다고 함


Ø 스페이츠는 아무도 스마트 하우스를 샀다!’는 식으로 말하지 않는다며, 소비자들이 자신의 집에 기술을 접목함으로써 얼마나 편리하게 되는가를 자연스럽게 이해할 수 있도록 하는 것이 향후 스마트 스피커 시장 확대에 기여할 것이라 강조했음

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1818호(2017. 10. 18. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

구글 하드웨어 신제품 발표, 제품 차별화 요소는 &lsquo;AI 최적화&rsquo;.pdf



[ 요 약 ]


구글이 작년에 이어 메이드 바이 구글(Made by Google) 행사를 통해 신제품을 대거 공개했는데올해 신제품 발표회의 테마는 하드웨어와 소프트웨어그 중에서도 인공지능(AI)의 통합이었음구글은 이번 신제품에 최신 AI 기술의 성과를 광범위하게 적용하며향후 AI가 기기 차별화의 결정적 요인이 될 것으로 바라보고 있음을 드러냈음스마트 기기의 하드웨어 차별성이 점차 엷어지는 가운데소프트웨어 최적화를 넘어선 AI 최적화가 제품 경쟁의 새로운 화두가 될 것으로 예상됨



[ 본 문 ]


ž 작년 10메이드 바이 구글(Made by Google) 하드웨어 신제품 5개를 일거에 출시했던 구글이 1년 만에 다시 신제품을 대거 발표하였음


Ø 이번에 발표한 신제품은 작년에 출시된 제품의 업그레이드 버전도 있지만, 구글로서는 새롭게 시도하는 제품들도 포함되어 있음


<자료> Google

[그림 1] Made by Google 2017


Ø 작년에 선보인 구글 자체 스마트폰 픽셀(Pixel)의 후속 버전으로 픽셀 2가 발표됐으며, 역시 작년에 선보인 인공지능(AI) 스피커 구글 홈(Google Home)은 이번에 구글홈 미니(Mini)구글홈 맥스(max)로 라인업이 확대되었음


Ø 올해 새롭게 선보인 제품으로는 액션 카메라인 구글 클립스(Google Clips)와 음악 재생 및 외국어 번역에 사용하는 블루투스 헤드셋 구글 픽셀 버즈(Google Pixel Buds), 그리고 크롬북의 상위 버전이라 할 수 있는 노트북 픽셀북(PIxelbook)이 있음


Ø 작년 10월에 이어 1년 만에 다시 하드웨어 발표회를 개최함으로써 향후 구글이 5월에 개최되는 연례 개발자 컨퍼런스 구글 I/O에 이어 10월의 신제품 발표회를 연례 행사화 할 가능성도 점쳐지고 있음


ž 이번 신제품 발표회의 테마는 하드웨어에 소프트웨어와 인공지능(AI)을 통합하는 것으로, 구글이 AI를 제품 차별화의 결정적 요인으로 바라보고 있음을 드러냄


Ø 구글홈 미니는 아마존의 소형 AI 스피커인 에코닷(Echo Dot)의 대항마 성격으로, 가격은 49 달러이지만 AI 가상비서 기능인 구글 어시스턴트(Google Assistant)가 탑재되어 있음


Ø 미니는 도넛 크기의 타원형 형상으로 상단에 LED가 탑재되어 기기 상태를 표시해주는데, 에코닷과 마찬가지로 가정 내 각 방에 하나씩 놓고 사용하는 것을 전제로 디자인 한 것으로 보이며, 구글이 집 전체 공간을 AI로 채우고 싶어함을 유추할 수 있음


Ø 맥스는 음질을 중요한 모델인 동시에 구글이 400 달러인 가격에 걸맞게 구글홈보다 20배 정도 성능이 강력하다고 소개할 정도로 AI 기반의 사운드 재생 기능이 뛰어난 기기임


Ø 2개의 4.5인치 우퍼를 내장해 깊이 있는 사운드 재생이 가능하며, 스마트 사운드(Smart Sound) 기능을 탑재하고 있어 주변 환경과 사용자의 컨텍스트에 맞게 음악을 재생할 수 있음



<자료> Google


[그림 2] 구글홈 미니(Mini)와 맥스(Max)


Ø 구글은 스마트 사운드 기능의 예로 AI가 방의 모양을 파악해 그에 적합한 사운드를 재생하거나, 아침 시간에는 볼륨을 좀 낮추어 재생하고 식기 세척기가 가동 중이어서 시끄러울 때는 볼륨을 높여 음악을 재생하는 것 등이 가능하다고 설명하고 있음


Ø 픽셀 2 스마트폰에는 지난 5월 구글 I/O에서 소개한 구글 렌즈(Google Lens) 기능이 처음으로 적용되었는데, 구글 렌즈는 구글 어시스턴트를 기반으로 렌즈에 비친 사물에 대한 정보를 불러들인 후 사진에 담긴 물체나 글자를 인식해 알려주는 AI 카메라임


Ø 픽셀북은 노트북과 태블릿 PC를 결합한 것으로 역시 구글 어시스턴트가 적용되어 있으며, 가령 픽셀북 펜을 이용해 디스플레이 화면 안의 특정 부분에 원을 그리면 구글 검색 엔진이 그 원안의 물체를 인식하고 관련된 정보를 검색해 줌


ž 구글이 AI를 신제품의 차별화 요소로 삼는 이유는, AI가 비단 구글의 하드웨어 신제품뿐 아니라 스마트 홈 생태계의 허브 기능을 담당할 것으로 보기 때문임


Ø 구글홈의 핵심 기능인 구글 어시스턴트는 스마트폰(안드로이드와 iOS), 스마트 워치(안드로이드 웨어), 텔레비전(안드로이드 TV) 등과도 연계할 수 있으며, 가상 비서의 인터페이스는 급속하게 음성으로 전환하고 있음


Ø 구글 어시스턴트는 생태계를 급속히 확장하고 있는데, 현재 스마트 홈 관련 기업 네스트(Nest), 필립스(Philips), 스마트씽스(SmartThings) 등이 내놓은 1천여 제품과도 연계가 가능함


Ø 특히 알파벳 산하의 네스트와 구글홈의 연계가 더욱 강화되고 있는데, 이번 기능 업그레이드로 네스트의 보안 카메라인 네스트 캠(Nest Cam)을 구글홈에서 조작할 수 있게 되었음


<자료> Google


[그림 3] 구글홈과 네스트 캠의 연계


Ø 이로써 가령 현관에서 무슨 소리가 나는 것 같을 때 구글홈에게 현관 앞 상황을 TV로 보여줘라고 명령하면, 구글홈이 네스트 캠에 찍힌 영상을 TV로 디스플레이 하는 것이 가능해졌음


Ø 또한 네스트의 스마트 초인종인 네스트 헬로(Nest Hello)도 구글홈에서 조작할 수 있게 되었는데, 네스트 헬로는 얼굴 인식 기능으로 방문자를 식별할 수 있는 친숙한 얼굴(Familiar Faces)라는 기능을 탑재하고 있음


Ø 따라서 누군가 초인종을 누르면 네스트 헬로가 그 인물을 인식해 구글홈에 알려주고, 구글홈이 이용자에게 방문자의 이름을 알려주는 것이 가능하며, 이런 기능을 활용해 네스트와 연계한 주택의 보안을 구글홈에서 집중 관리하는 것이 가능함


Ø 구글 어시스턴트가 허브가 되는 스마트 홈은 개인화 서비스도 가능한데, 보이스 매치(Voice Match) 기능을 통해 동시에 여섯 명의 목소리를 구분해 알아 듣고 개별 대응이 가능하기 때문


Ø 개인 맞춤형 서비스의 예로 이번 신제품 발표회에서는 에브리데이 루틴(Everyday Routines) 기능이 소개되었는데, 이는 한 단어만 듣고 그 사람과 관련된 여러 가지 명령을 동시에 실행하는 것으로 구글의 지향점을 잘 보여주고 있음


Ø 가령 식구들 중 회사로 출근을 해야 하는 사람이 있을 경우, 이 사람이 아침에 일어나 좋은 아침이라고 한 마디만 하면, 구글홈이 그의 하루 일정을 확인하고 일정에 따른 이동 경로의 도로 정체 정보를 알려주며 주요 뉴스를 읽어주도록 설정할 수 있음


Ø 또한 아이들이 구글홈에게 우리 게임하자라고 말을 할 경우, 아이들의 목소리를 인식하여 아이들이 안전하게 즐길 수 있는 게임을 실행하도록 설정할 수도 있음


ž 구글은 AI가 스마트 홈의 허브로 선택될 수 있도록 인간 친화적인 특성을 띠게 하는 데도 공을 들였는데, 여기에는 딥마인드(DeepMind)의 새로운 음성합성 기술이 기여를 하였음


Ø 구글홈의 음성 발화는 고급 AI가 적용되어 매우 매끄럽게 들리는데, 여기에는 딥마인드가 지난해 발표한 새로운 음성 합성(Speech Synthesis) 기술이 관여되어 있음


Ø 딥마인드가 새롭게 발표한 웨이브넷(WaveNet)은 심층신경망(Deep Neural Network)을 이용해 기계음이 인간에 가깝게 자연스럽게 발성할 수 있게 해주는 음성 합성 기술임


Ø 일반적으로 음성 합성은 말을 아주 작은 단위로 나눈 다음 필요한 음운, 음소, 단어에 맞게 조립하는 음성 연결 합성(Concatenative TTS)이라는 기법 사용하는데, 이 때문에 기계음은 말 그대로 기계적이고 어색한 톤으로 발화가 됨


Ø 딥마인드는 기존의 방식과 전혀 다른 접근 방식을 취했는데, 웨이브넷은 많은 수의 음성 샘플을 배우고 음성 파형(Audio Waveform)을 잘게 세분화 해 분석함으로써 음성 만으로는 알 수 없었던 숨 고르기나 단어 혹은 문장끼리 합쳐지는 방식까지 이해가 가능하게 하였음


Ø 구체적으로 살펴 보면 컨볼루셔널 신경망(Convolutional Neural Network, CNN)이 발화의 구성을 파악하여 어떤 음색(Tone) 후에 어떤 음색이 이어지는지, 어떤 파형(Waveform)이 자연스러운지 학습하게 되며, 이를 토대로 아주 부드러운 음성을 합성하게 됨


Ø 딥마인드는 웨이브넷이 인간의 미묘한 톤이나 억양, 말할 때의 속도 등을 그대로 재현할 수 있다고 설명했는데, 음성 연결 합성 방식이나, 인간 음성 샘플 없이 기계가 음성을 생성하는 방식(Parametric TTS) 등 기존 기술과 블라인드 테스트를 한 결과 인간의 실제 음성에 육박하는 수준의 높은 점수로 1위를 차지했다고 함


Ø 단 작년 발표 시점에서 웨이브넷은 음성 합성을 빠르게 수행 할 수 없어 0.02 초의 오디오를 생성하는데 1 초가 필요했으나, 그 동안 알고리즘 개선을 통해 빠른 음성 합성까지 가능해졌다고 하며, 현재 1 초 길이 오디오를 50 밀리 초에 생성하므로 실시간 사용이 가능하다고 함


[1] 딥마인드 웨이브넷과 음성 합성 기술의 비교

 

Concatenative

Parametric

WaveNet

인간의 음성

미국식 영어

3.86

3.67

4.21

4.55

만다린 중국어

3.47

3.79

4.08

4.21

<자료> DeepMind


ž 하드웨어들의 주요 기능이 점차 천편일률적으로 되어 가는 상황에서, 이번 구글의 신제품 발표회는 향후 AI 최적화가 스마트 기기의 시장 성패를 가르게 될 것임을 강하게 시사


Ø 구글홈을 비롯해 이번에 구글이 발표한 제품들의 배후에는 최신 AI 기법이 광범위하게 사용되고 있는데, 이용자의 음성을 인식하는 데뿐만 아니라 음성 합성 역시 AI 없이는 매력적인 특색을 실현할 수 없음을 보여주고 있음


Ø 소프트에어 기업인 구글이 자체 하드웨어 생산에 나선 데에는 여러 가지 이유가 있겠으나, 하드웨어를 통한 차별화는 이제 한계에 다다르고 소프트웨어를 통한 차별화, 그 중에서도 AI에 의한 차별화가 제품 경쟁력의 핵심 요소가 될 것으로 판단했기 때문이라 볼 수 있음


Ø 가령 지금까지 스마트폰의 경쟁 구도는 애플의 소프트에어 최적화와 삼성전자의 하드웨어 고사양화로 요약할 수 있는데, 아이폰이 상대적으로 낮은 하드웨어 사양을 소프트웨어 최적화로 커버했다면, 갤럭시 폰은 소프트웨어의 단점을 하드웨어 혁신으로 커버하는 전략이었음


Ø 그러나 최근 들어 아이폰이나 갤럭시 폰을 비롯해 대부분의 스마트폰 사양들은 유사해지고 있는데, 구글은 이를 하드웨어 혁신의 속도가 둔화된 것, 즉 하드웨어 부문을 직접 관리하는 부담이 적어지는 신호로 받아들였을 가능성이 큼


Ø 따라서 보다 중요해지는 것은 애플과 같은 소프트웨어 최적화 역량인데, 구글은 안드로이드 OS와 하드웨어의 최적화에 덧붙여 AI 최적화를 무기로 하드웨어 비즈니스에 뛰어들려는 것으로 해석할 수 있음


Ø 하드웨어 경쟁력보다 소프트웨어 경쟁력이 압도적 이윤을 가져다 줄 수 있다는 점은 이미 애플과 삼성전자의 경쟁에서 확인된 바 있거니와, 구글은 이에 더해 AI가 제품의 차별화와 이윤을 가져다 줄 것이라 주장하는 것임


Ø 구글이 던진 AI 최적화의 화두는 스마트 디바이스 시장의 경쟁 지형을 새롭게 재편할 가능성이 크며, 디바이스 제조업체들 앞에 쉽지 않은 숙제가 던져진 셈

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1801호(2017. 6. 21 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

신제품 홈팟(Homepod)에서 재확인된 애플의 프라이버시 우선 정책.pdf



[ 요 약 ]


애플 연례 개발자 컨퍼런스 WWDC 2017에서 예상대로 애플은 아마존 에코와 구글홈에 맞설 인공지능 스피커 홈팟(Homepod)을 발표하였음애플은 홈팟의 고음질 스피커로서 장점을 부각하고 있지만 홈팟의 부족한 인공지능 기능에 비판과 불만의 반응이 나오고 있음이러한 AI 성능의 차이는 사용자들의 데이터를 클라우드에서 처리하는 경쟁사들과 달리 기기 내에서만 처리하는 애플의 정책 때문으로, AI 기술의 활용에 있어 프라이버시 우선을 내세우는 애플의 철학을 보여주고 있음


[ 본 문 ]


ž 애플은 연례 개발자 컨퍼런스인 WWDC 2017에서 iOS 11 등 새로운 운영체제와 함께 신형 아이패드 프로(iPad Pro)와 스마트 스피커 홈팟(HomePod) 등 다수의 신제품을 발표


Ø 기조 연설에 나선 팀 쿡 CEO는 현재 앱스토어에 1,600만 명의 개발자가 등록되어 있으며, WWDC75개 국에서 5,300명의 개발자가 참여하는 세계 최대의 개발자 회의로 참가자의 연령 폭도 넓은데, 올해 대회의 최연소 참가자는 10, 최고령은 82세라고 소개하였음


<자료> Mac Rumors


[그림 1] WWDC 참가 최연소 및 최고령 개발자


Ø 기조 연설에 앞서 코믹한 동영상을 보여주었는데, 실수로 애플 데이터센터의 전원이 뽑히며 아이폰 앱을 사용할 수 없게 되자 전세계가 혼돈 위기에 빠진다는 내용으로, iOS 앱이 애플에게 정말 중요한가를 보여주며 앱 개발자에게 감사의 뜻을 전달하려는 의도였음 (동영상의 제목은 Applocalypse인데, 이는 성서에 나오는 세상의 종말을 의미하는 apocalypse와 app을 결합한 것)


[동영상] Appolcalypse(앱 세상의 종말) 


Ø 개별 신제품의 상세한 내용은 수석 부사장 크레이그 페데리히와 부사장 필 쉴러가 프레젠테이션 했는데, 올해 WWDC에서 선보일 것으로 기대를 모았던 스마트 스피커 제품으로는 홈팟(HomePod)을 발표하였음.


Ø 지금까지 12.9인치 버전과 9.7인치 버전의 2가지 모델로 라인업을 구성한 아이패드 프로(iPad Pro)와 관련해서는 완전히 새로운 모델인 10.5인치 버전을 발표하였음


Ø 애플 기기에 탑재되는 운영체제인 iOS, macOS, watchOS, tvOS 등에 대해서도 각각 업데이트 내용을 발표했는데, 특히 iOS 11에서는 증강현실(AR)을 지원한다는 점이 눈길을 끌었음


Ø 맥북과(MacBook)과 맥북 프로(MacBook Pro) 7세대 코어 프로세서를 탑재한 새로운 모델을 발표했으며, 아이맥(iMac) 역시 7세대 코어 프로세서를 탑재한 상위 모델로 아이맥 프로를 선공개하며 사전 주문을 시작하였음


ž 스마트 가전인 홈팟(HomePod)은 음성 인식 가상 비서인 시리(siri)를 통해 조작되는 7인치 높이의 스피커인데 애플은 제품 컨셉을 가정 내 음악 환경의 재발견이라고 소개




Ø 인공지능(AI) 스피커가 새로운 가전 시장으로 자리잡을 가능성이 확인됨에 따라, 이번 WWDC 2017에서 애플이 이미 시판 중인 아마존의 에코나 구글의 구글 홈, 그리고 마이크로소프트가 HP와 제휴를 통해 상용화 예정인 코타나 탑재 스피커 등과 경쟁할 제품을 선보일 것이라는 점은 공공연한 비밀이었음


Ø 예상대로 스피커 제품이 발표되기는 했으나 필 쉴러 부사장은 홈팟이 AI 가상 비서를 탑재하고 있다는 점보다는 중저음을 강화해 주는 우퍼소리가 나는 방향을 조정하는 빔포밍(beamforming)이 가능한 트위터(고음전용 스피커) 7고급 에코 제거 기능을 갖춘 마이크 6개를 탑재한 점 등 스피커로서 음질의 장점을 주로 어필하였음


Ø 홈팟 내부에는 아이폰 등에 사용해 온 애플의 CPU A8이 탑재되어 있어 높은 처리 성능을 갖추고 있는데, 이 역시 실시간 음향 모델링과 빔포밍 등 소프트웨어에 의한 음질의 향상을 위한 연산 처리를 위한 것으로 홈팟의 음질은 보스 등과 같은 프리미엄 급이라고 설명



<자료> Apple

[그림 2] 애플 홈팟 내부 부품 구성



Ø 홈팟은 애플의 구독형 음악 스트리밍 서비스 애플뮤직과 연동되며, 시리를 통한 음성 제어 역시 음악과 관련된 질문에 대한 대응을 특히 신경 써 개발했다고 함


Ø 물론 음악에 특화되어 있지만 경쟁 제품들과 마찬가지로 홈팟을 통해 뉴스와 날씨, 스포츠 경기 결과, 주변 교통 정체상황 등의 정보 읽기, 타이머 설정, 애플의 가전 제어 기술사양인 홈킷(Home Kit)을 지원하는 기기를 음성 명령으로 제어하는 것 등도 가능하다고 함


[1] 아마존, 애플, 구글의 인공지능 스피커 사용 비교

구분

아마존 에코

애플 홈팟

구글 구글홈

가상 비서

알렉사

시리

구글 어시스턴트

음악 지원

아마존 뮤직, 프라임 뮤직, 아마존 뮤직 언리미티드, 스포티파이 프리미엄,

판도라, 튠인, 아이하트레이디오, 오더블

애플 뮤직

구글플레이 뮤직, 스포티파이 프리미엄, 유튜브 뮤직, 판도라, 아이하트레이디오, 튠인

멀티 룸

현재는 미지원(예정)

에어플레이2

크롬캐스트 오디오

스마트홈 및

써드파티 지원

지원

홈킷만 지원

지원

마이크

원거리 음장 7

원거리 음장 6 +

저주파 보정 1

원거리 음장 2

스피커

2인치 트위터 +

2.5인치 우퍼

트위터 7 + 우퍼

2인치 드라이버 + 2인치 패시브 라디에이터 2

통신 연결

블루투스, 와이파이

와이파이

블루투스, 와이파이

크기, 무게

235 x 84 mm,

1,061 g

172 x 142 mm,

2,495 g

142.8 x 96.4 mm,

476g

가격

180 달러

349 달러

129 달러

<자료> Android Authority


ž 홈팟에 대한 현지 언론들의 평가는 음악 기능은 탁월할 지 모르나 중요한 인공지능 기능은 기대에 못 미친다는 견해가 지배적이나, 애플은 이런 지적에 크게 개의치 않는 모습


Ø 홈팟이 음악을 재생 할 때, 이봐 시리, 이 노래 좋은데라고 말하면, 홈팟은 여러 장르나 분위기의 재생 목록 중에서 사용자의 취향을 학습하게 되고, 이 학습 정보는 사용자의 여러 애플 기기에 걸쳐 공유됨


Ø 마찬가지로 홈팟에 이봐 시리 지금 이 곡의 드러머가 누구지?라고 물으면 홈팟은 해당 정보를 검색해 알려주거나, 드러머 정보를 바탕으로 다음 재생 목록을 만들어 공유할 수도 있음


Ø 홈팟은 공간 인식 기술을 이용하여 방의 구석, 책상 위, 책장 등 자신이 놓여있는 위치를 인식하여 더 나은 음질을 전달하는 기능도 갖추고 있음


Ø 그러나 홈팟의 음악 전달 기능이 뛰어나다고는 해도, 아마존 에코나 구글홈 같은 AI 기반 스마트 홈 허브를 기대했던 사람들은 홈팟에 대해 부정적 평가를 내놓고 있는데, 시리를 홈팟의 핵심 기능이 아니라 장식쯤으로 여겨야 한다는 신랄한 비판도 제기되고 있음


Ø 인공지능 스피커 시장의 후발주자이면서도 새로운 혁신이나 더 나은 기능 개선조차 보여주지 못하면서 오히려 가격은 349달러로 아마존 에코(179.99달러)나 구글홈(129 달러)에 비해 상대적으로 높게 책정한 점도 빈축을 사고 있음


Ø 스피커로만 보아도 부담스러운 가격에 연계 음악서비스도 제한적이기 때문에 애플 충성 고개들이라도 홈팟을 구매할 지는 미지수라는 예상이 많지만, 애플은 이런 평가에 아랑곳없이 뛰어난 음질로 몰입감 있는 개인화된 음악 경험을 제공할 수 있다는 점을 강조하고 있음


<자료> Android Authority


[그림 3] 아마존 에코 vs. 애플 홈팟 vs. 구글홈


ž 예상대로 애플이 시리 기반의 스피커 제품을 발표하긴 했으나, 재차 확인된 것은 스피커 기기를 대하는 애플의 자세가 아마존과 구글 등 경쟁자들과 크게 다르다는 점


Ø 애플이 시리 관련 기능보다 음질에 대한 설명에 많은 비중을 둔 것은 경쟁사들과 겨냥하는 시장이 다르기 때문이란 분석인데, 경쟁사인 아마존 역시 홈팟에 대해 에코와는 철학이 다르기 때문에 소비자들의 머리 속에서 두 제품이 다툴 것으로 보이지 않는다는 평을 내놓고 있음


Ø 에코와 구글홈의 활용 공간이 거실, 주방, 침실 등으로 넓은 데 비해, 애플은 홈팟의 이용 공간을 거실로 한정하고 고급 오디오 기기로서 차분히 음악을 즐긴다는 목적에 충실히 따르게 하려는 모습을 보이고 있다는 것



Ø 홈팟에 탑재되는 Anonymous ID(익명)라는 기능도 주요 차이점 중 하나인데, 홈팟은 애플 아이디(Apple ID)로 로그인하지 않아도 홈팟을 사용할 수 있는 구조로 되어 있음


Ø 반면 아마존 에코나 구글홈은 각각 아마존과 구글 계정으로 로그인 한 상태가 아니면 사용할 수 없으며, 구글홈의 AI 가상 비서인 구글 어시스턴트의 경우 사용자의 음색 차이까지 식별해 맞춤형 응답을 할 수 있다는 점을 차별화 포인트로 내세우기까지 하고 있음


ž 스피커를 바라보는 입장 차이는 근본적으로 인공지능(AI) 활용 방식의 차이에서 기인하는데, 애플은 단말기 상에서만 사용자의 데이터를 처리한다는 원칙을 고수하고 있음


Ø 시리가 아마존 알렉사나 구글 어시스턴트보다 사용자 응답의 정확성이 떨어진다는 평가에 대해 애플 스스로도 어느 정도 인정하고 있는데, 애플이 양질의 데이터를 가지고 있다고는 하지만 구글과 아마존이 보유한 데이터 양에는 비견할 바가 못되기 때문


Ø AI의 성능은 AI를 학습시키는 데이터의 양과 질에 의해서 크게 좌우되기 마련인데, 애플은 사용자 프라이버시 우선 원칙을 고수하고 있고 이로 인해 시리는 6개월 동안만 데이터를 저장함


Ø 아마존이나 구글의 경우 사용자의 데이터를 지속해서 저장하고, 이를 바탕으로 AI 서비스를 제공하기 때문에 빅데이터라는 측면에서 장기적으로 애플에 우위를 가질 수밖에 없음


Ø 사진 분석 서비스를 비교해 보면, 구글 포토 서비스는 일단 클라우드에 수 많은 이용자들의 사진을 백업한 후 얼굴 인식이나 피사체의 분류 등을 수행하는 반면 애플은 아이폰과 아이패드 상에서 사진을 분석하고 얼굴 인증이나 피사체 분류 장면 분석 등을 수행하고 있음


Ø 이 때문에 인터넷에 연결되지 않은 와이파이 전용 아이패드에서 사진을 찍어도 제대로 분류가 이루어지는 것인데, 대신 이 경우 모바일 장치의 분실이나 손상으로부터 데이터를 지킬 수 없는 단점이 있기 때문에 애플의 경우 아이클라우드에 별도 백업을 권장하고 있음


ž 애플의 AI 전략을 상징하며, iOS 11 등에도 탑재한다고 발표한 코어ML(Core ML) 역시 클라우드가 아닌 모바일 기기 상에서의 딥러닝(Deep Learning) 실행에 초점을 맞추고 있음


Ø 코어ML은 아이폰과 아이패드 등의 앱에서 기계학습과 딥러닝(심층학습) 기반의 AI 기능을 탑재하기 위한 소프트웨어 프레임워크임


Ø 앱 개발자는 코어ML을 통해 제공되는 얼굴 인식이나 문자 인식 등의 API(응용 프로그래밍 인터페이스)를 호출하는 코드를 작성하기만 하면 이러한 AI 기능을 자신의 앱에 구현할 수 있게 되며, 게다가 이러한 AI 기능을 클라우드가 아닌 모바일 장치 상에서 처리되도록 할 수 있음


Ø 코어ML은 기존의 딥러닝 소프트웨어 라이브러리인 카페(Caffe)케라스(Keras)를 사용하여 개발된 딥러닝 모델을 모바일 기기에서 이용할 수 있게 해주는 기능도 갖추고 있어, 앱 개발자들이 보다 쉽게 딥러닝을 모바일 기기에서 실행할 수 있게 하는데 초점을 맞추고 있음


Ø 딥러닝을 통한 학습이나 추론을 하는 경우, 클라우드에서 실행하는 기존 방식으로는 네트워크가 단절되면 AI 기능을 활용할 수 없게 되는 단점이 있었는데, 모바일 기기 자체에서 AI 기능을 사용할 수 있게 함으로써 개발 편의성뿐 아니라 사용자 프라이버시 보호도 개선한 것임


ž 데이터 획득과 활용에 대한 애플의 접근방식이 서비스 측면에서 더 나은 차별성을 제공할 것 같지는 않지만, 최소한 프라이버시 이슈에 대한 확실한 관리 방안은 될 것으로 보임


Ø 애플과 구글의 사진 서비스는 현재 겉보기로는 별 차이가 없어 보이지만, 자신의 사진이 다른 사람의 사진과 함께 분석되는 것과 개인의 사진이 프라이버시를 유지한 형태로 분석되는 것의 차이는 시간이 지날수록 더 선명하게 드러날 가능성이 있음


Ø 특히 사진 이외 데이터의 처리를 생각해 보면 애플과 경쟁사의 접근방식을 바라보는 시각이 크게 달라질 수 있는데, 가령 프라이버시 관점에서 사진보다 더욱 민감할 수 있는 개인의 건강이나 의료 관련 데이터가 그러함


Ø 아이폰은 사용자의 단말기 사용 상황이나 메시지를 분석하고 그 장면에 가장 적합한 앱이나 응답 문구를 제시하는 구조를 갖추고 있으며, 개인의 건강 및 의료 정보 데이터 역시 아이폰 또는 애플워치 내에 축적하려 하고 있음


Ø 이번에 발표된 애플워치의 새 운영체제 watchOS 4의 경우, 시리를 이용한 지능형 시계 인터페이스 기능을 새로 탑재했고, 기계학습 기반 알고리즘으로 미팅 일정 등을 적절히 업데이트하며, 운동 기능은 여러 장비와 연결하여 정확한 데이터를 기반으로 사용자를 지원하는데, 애플워치의 데이터 역시 기기 자체와 아이폰이라는 범위를 넘어 저장되지 않음


Ø 이에 비해 구글의 경우 의료 데이터를 사진 데이터와 같은 방식으로 처리한다면 모든 이용자의 데이터를 일단 클라우드로 모은 후 분석을 해야 하는데, 사람들이 의료 데이터도 사진 데이터와 마찬가지로 구글 클라우드로 큰 거부감 없이 자동 백업할 지는 미지수임


Ø 사진에도 많은 개인 정보가 포함되지만, 건강 및 의료 데이터를 위시해 생활에 밀접한 정보의 분석을 할 경우 프라이버시 보호가 더욱 중요해지는데, 애플이 단말기로 제한된 분석 방식을 고수하는 것은 향후 개인들의 개인정보보호 의식의 높아지는데 대한 위험 회피 수단이 될 수 있을 것임


<자료> Apple

[그림 4] 애플의 프라이버시 우선 정책


ž 애플의 프라이버시 우선 정책은 향후에도 변함이 없을 것으로 전망되며, 기술의 개발 방향도 단말기 상에서 빠르고 신속한 데이터 처리에 초점이 맞춰질 것으로 보임


Ø 애플은 맥용 프로세서는 인텔의 공급에 의존하고 있지만, 아이폰용 프로세서는 자체 설계 한 전용 모델을 이용하고 있는데, 이는 저전력과 고성능을 실현하고 앱의 시작과 전환 등 스마트폰의 사용 성능에서 안드로이드폰에 대한 우위성을 확보하기 위해서임


Ø 애플은 아이폰의 핵심 프로세서를 아이패드나 애플TV에도 활용하고 있으며, 또한 애플워치용으로는 S1, S2라는 스마트 워치 전용 프로세서를, 에어팟용으로는 W1이라는 프로세서를 개발, 구현하였음


Ø 이처럼 애플은 자사 디바이스에 필요한 전용 칩을 독자적으로 제공하는 체제를 정비해왔기 때문에, 단말기에서 기계학습 등의 AI 처리에 있어서도 자연스럽게 자신들이 직접 칩을 설계하고 구현하려는 모습을 보이고 있음


Ø WWDC 2017을 앞두고 애플은 최신 AI 전용 프로세서인 애플 뉴럴 엔진(Apple Neural Engine)이 신형 아이폰과 아이패드에 탑재한다고 밝혔는데, 이점 역시 구글이 새로 선보인 TPU가 수퍼컴퓨터와 서버 환경에 도입되는 대규모 처리를 위한 프로세서인 것과 대비되는 지점임


Ø 연산처리는 작은 모바일 기기 상에서 하는 것보다 클라우드에 있는 수 많은 컴퓨터에 의해 병렬처리 되는 쪽이 자연스러운 추세이지만, 애플은 사용자 데이터를 가능한 한 아이폰 밖으로 내보내지 않고 처리하는 것이 목표이므로 AI 칩 역시 기기에 내장하는 것임


ž 애플의 프라이버시 우선 정책이 자충수일지 선견지명이 될 지는 향후 이용자가 제공하는 빅데이터의 획득 및 활용에 관한 사회적 협의가 어떻게 이루어지느냐에 따라 판명될 전망


Ø 아마존과 구글이 택하고 있는 클라우드 기반 인공지능 처리 방식에 대해서는 데이터 보안을 우려하는 목소리도 서서히 나오고 있는데, 이용자들이 에코나 구글홈이 집 안에서 이루어지는 대화들을 전부 다 듣고 있다는 사실을 인식하기 시작했기 때문


Ø 게다가 에코에 카메라가 장착되기 시작하면서부터는 대화뿐 아니라 가정 내의 영상이 클라우드에 전송되는 것이기 때문에, 만일 보안이 뚫리게 된다면 다양하게 악용되어 잠재적 피해의 범위가 매우 커질 수 있다는 우려의 목소리가 더욱 힘을 얻고 있음


Ø 보안의 문제가 아니더라도, 개인의 데이터를 클라우드로 모은 후 서비스 기업이 이를 통해 수익을 창출한다면 그 수익을 사용자들에게 배분하거나 혹은 데이터를 획득하는 시점에서 보상이 주어져야 한다는 의견도 있음


Ø 사진 같은 경우 클라우드에 백업 공간을 무료로 제공한다는 반대급부가 있기는 하나, 그 비용과 서비스 수익의 크기가 대칭적인지에 대해서는 이용자들이 판단할 근거가 없음


Ø 이런 면에서 볼 때, 프라이버시 보호 문제가 지금보다 더욱 강하게 대두된다면, 궁극적으로 애플의 접근방식이 사람들로부터 선택될 가능성도 있는 것이며, 실제로 애플은 이런 시나리오로 전개될 것이라는 판단을 하고 있는 것처럼 보임


Ø 구글 역시 안드로이드 차기 버전인 Android O에서는 모바일 기기에 딥러닝 프레임워크인 텐서플로우 라이트(TensorFlow Lite)를 탑재할 예정인데, 이는 애플과 동일한 방식으로 프라이버시 이슈를 어느 정도 염두에 둔 행보로 볼 수 있음


Ø 아마존, 구글, MS 등 경쟁사들이 클라우드 기반 인공지능을 통해 애플의 접근 방식보다 압도적인 편의성과 혁신을 창출할 수 있을지, 아니면 그렇지 않은 상황에서 프라이버시 이슈가 대두되며 애플에 상황이 유리해질 것인지 향후 관심 있게 지켜볼 대목임