※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1851호(2018. 6. 20. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

AI로 강화된 이미지 검색 기능 ‘구글 렌즈’의 가능성과 과제.pdf



[ 요 약 ]


구글이 인공지능(AI) 기술을 접목해 이미지 인식 기능이 한층 강화된 구글 렌즈(Goolge Lens)'의 새로운 버전을 발표하였음. 구글 렌즈는 구글이 지난 2010년에 공개했으나 성공하지 못했던 고글 서비스의 업그레이드 버전으로 이미지 검색을 내비게이션, 주소록 관리, 온라인 쇼핑 등으로 곧 바로 연결시킬 수 있음. 구글 렌즈는 현단계 컴퓨터 비전의 최고 수준을 보여주고 있지만, 스마트폰의 제한된 자원으로 AI 분석을 수행하기 때문에 연속 사용시간이 20여분에 불과해 일상적인 이용 서비스가 되기엔 다소 시간이 소요될 전망



[ 본 문 ]

201711월에 구글 렌즈(Google Lens)’를 선보였던 구글이 6개월 만에 기능을 대폭 강화시킨 최신 버전을 내놓았음


구글 렌즈는 기본적으로 증강현실(Augmented Reality) 기능이며, 카메라가 포착한 개체에 정보를 추가하는 구조임


구글 렌즈는 구글의 자체 제작 스마트폰인 픽셀(Pixel) 2’ 등에 탑재되어 있는데, 인공지능 가상비서인 구글 어시스턴트(Google Assistant)’와 연계해 작동하므로, 구글 렌즈를 시작하려면 구글 어시스턴트 화면에서 렌즈 아이콘을 터치하면 됨


구글 렌즈는 앱의 형태로도 제공되기 때문에 플레이스토어에서 다운로드 받아 사용할 수도 있으나, AI 전용 프로세서 등 하드웨어 종속적 측면이 있어 기능을 온전히 이용할 수 있는 스마트폰 기종은 픽셀2, LG G7, 소니 엑스페리아 XZ2 등으로 한정됨


이번에 발표된 구글 렌즈 최신 버전에서는 이미지 검색 기능이 큰 주목을 받고 있는데, 이미지 검색 기술 자체는 새로운 것이 아니나, 고급 AI 기술이 접목되면서 이미지 검색 기능의 정확도가 크게 향상된 것이 특징


이미지 검색 기능은 기술 수준이 향상될수록 활용 분야가 넓어지고 활용 가치도 커지기 때문에 구글 렌즈 최신 버전의 성능에 많은 관심이 모이고 있음


구글 렌즈는 우선 인식 대상이 텍스트임을 알고 이를 문자로 변환할 수 있는데, 그 의미를 이해하기 때문에 연관된 기능을 스스로 하거나 사용자에게 제안할 수 있음


가령 명함을 카메라로 읽으면 그대로 주소록에 등록할 수 있고, 명함에 기재되어 있는 전화번호를 인식하여 곧바로 전화를 걸 수도 있으며, 주소를 인식하면 구글 지도(Google Maps)를 호출하여 해당 위치까지 경로를 탐색할 수 있음


또한 길을 가다 보게 된 포스터에 관심이 있는 가수의 콘서트 안내 내용이 있다면 구글 렌즈를 통해 콘서트의 공연 프로그램과 연락처 정보를 추출할 수도 있음


구글 렌즈는 소위 OCR(광학문자인식)로서 기능하는 것이지만 그 내용의 의미까지 이해하기 때문에 활용가치가 보다 커지는 것임



<자료> Gadget Hacks

[그림 1] 구글 렌즈로 명함과 포스터 인식


구글 렌즈의 이미지 인식 수준은 회화나 조각 등 예술작품을 식별할 수 있을 정도로 높기 때문에 고도의 전문성을 요하는 서비스에도 활용이 가능함


미술관에서는 오디오 가이드를 빌리거나 도슨트의 설명 시간을 기다리는 대신 구글 렌즈에 가이드 역할을 맡길 수 있는데, 구글 렌즈로 그림을 보면 작품의 제목과 개략적 설명이 나타나고, 표시된 링크를 따라 가면 작품 내용에 대한 설명을 읽을 수 있음


예를 들어 인상파 화가 폴 세잔의 그림 샤토 누아(Château-Noir)’나 조각가 오귀스트 로댕의 청동 조작 작품 칼레의 시민(Les Bourgeois de Calais)’을 정확히 인식하고 소개와 연관 정보를 제시해 줌


미술관에서 촬영한 사진을 나중에 구글 렌즈로 볼 때도 비슷한 개요 설명이 표시되는데, 구글 렌즈의 그림에 대한 인식 수준은 아주 높다는 평을 받을 받고 있어, 앞으로 사람들의 미술 감상 스타일이 바뀔 수 있다는 전망도 나오고 있음


<자료> the Verge

[그림 2] 회화와 조각 미술품을 정확히 인식


미술관 도슨트의 역할 대행과 마찬가지로 구글 렌즈는 관광 가이드 역할도 대신할 수 있는데, 랜드마크가 되는 주요 건물과 기념물, 조형물을 인식할 수 있기 때문


주변의 건물 등에 카메라를 비추면 구글 렌즈는 해당 건물을 인식해 그 이름을 표시해 주며 링크 정보를 함께 제공하는데, 가령 구글 본사를 카메라로 찍으면 구글플렉스(Googleplex)’라는 건물명을 정확히 보여 줌


주요 건물을 촬영한 사진을 나중에 구글 렌즈에서 보면 관광했던 장소의 이름과 간략한 소개글을 보여 줌


<자료> the Verge

[그림 3] 유명 랜드마크 건물의 인식


곳곳에 수없이 존재하는 랜드마크를 인식하는 것은 생각보다 고도의 기술을 필요로 하는데, 특히 보는 각도와 그림자의 방향이 다르기 때문에 랜드마크 이미지를 정확히 판정하는 것은 미술품의 판정보다 매우 어려움


현재 구글 렌즈가 정확히 인식할 수 있는 랜드마크의 수는 한정되어 있고 인식 정확도도 완전하지 않아 향후 더욱 기술 개선이 필요한 상황이라고 함


구글 렌즈를 식물도감으로 활용하는 것도 가능해졌는데, 단 화초에 대한 인식 능력의 제법 괜찮은 편이지만 나무와 잎모양에 대한 판정 능력은 아직 크게 떨어지는 편임


카메라로 집 주변이나 유원지에서 찍은 화초 산진을 보면 구글 렌즈는 자스민(Jasmine)’이라거나 하나비시소우(California Poppy)’라는 식으로 알려주기 때문에 휴대형 식물도감으로 사용하는 것도 가능함


식물은 비슷비슷해 보이는 것들이 많기 때문에 판정이 어렵고, 아주 고도의 학습된 신경망이 필요하지만 구글 렌즈로 꽃을 비추면 반응 속도가 빠르며 정답률도 나쁜 편이 아님


반면, 나무나 나뭇잎에 대해서는 알고리즘 교육이 아직 충분치 않은 것인지 인식 능력이 크게 떨어진다는 평을 받고 있음


전반적으로 비록 제한 사항은 있지만 구글 렌즈로 주변 식물의 종류를 일부나마 알 수 있게 된 것은 그 자체로 컴퓨터 비전 기술의 진화를 잘 보여주는 사례라는 반응이 주를 이루고 있음


이처럼 AI와 결합으로 한층 진화된 구글 렌즈의 이마지 인식 성능을 응용하여 구글은 새롭게 스마트 텍스트 선택기능과 스타일 매치기능을 추가하였음


스마트 텍스트 선택(Smart Text Selection)’ 기능은 구글 렌즈로 인식한 텍스트 중에서 특정 부분을 선택하는 기능인데, 가령 레스토랑 메뉴 중에서 무엇인지 잘 몰라 궁금한 요리를 선택하면 구글 렌즈가 그 내용을 설명해 주게 됨프랑스어나 이탈리아어 등으로 적혀 있을 경우에는 선택 후 번역(Translate)’ 버튼을 터치하면 되는데, 요리의 종류가 무엇이고 주요 사용 재료가 무엇인지를 설명해 줌

<자료> Android Authority

[그림 4] 구글 렌즈의 스마트 텍스트 선택


스타일 매치(Style Match)’는 패션과 가구 등을 제안하는 기능인데, 구글 렌즈로 세련된 옷의 사진을 보면 그 옷과 동일하거나 유사한 디자인의 의류 상품을 제시해 주는데, 제시된 상품이 마음에 든다면 곧 바로 구매할 수도 있음


비단 의류만 그런 것은 아니고 신발이나 가방을 보면, 같은 취향의 상품을 표시해 주고 집안에서 구글 렌즈로 가구를 비추어도 유사한 가구 제품을 보여 줌


이미지로 유사 상품을 제안하는 기능은 아마존 등 쇼핑몰에서도 제공하고 있지만, 구글 렌즈는 카메라에서 포착한 라이브 이미지를 실시간으로 영상 분석한 다음 디자인이 비슷한 상품을 검색해 제시하기 때문에 보다 고도의 기술이 필요한 것임



<자료> Digital Trends

[그림 5] 구글 렌즈의 스타일 매치


◾ 구글 렌즈의 새로운 기능을 뒷받침하는 엣지 컴퓨팅 기반 실시간 분석은 현단계 최고 수준의 컴퓨터 비전 기술을 보여주나 배터리 과소모 등 해결해야 할 난제도 남아 있음


기술적 측면에서 구글 렌즈의 가장 큰 기능적 특징은 실시간 결과(Real-Time Results)’라 할 수 있는데, 말 그대로 실시간으로 객체를 파악할 수 있게 해 줌


구글 렌즈가 탑재된 카메라로 주위를 둘러보면 렌즈에 찍힌 객체 주변에 흰 점이 나타나는 것을 볼 수 있는데, 이 점들은 AI로 분석한 영역을 나타내는 것이며 실시간으로 파악한 후 관련된 정보를 표시해 주는 것임, 구글 렌즈는 시스템 아키텍처 상의 맨 끝(엣지, edge)에 위치한 스마트폰에서 AI로 이미지 분석을 수행하고 메타 정보를 클라우드로 전송하여 백엔드에서 검색 프로세스를 실행하는 구조임


<자료> Digital Trends

[그림 6] 구글 렌즈의 실시간 이미지 분석


이미지 분석에서 엣지 컴퓨팅을 사용한 것은 놀라운 일인데, 스마트폰의 제한된 컴퓨팅 자원으로 신경망을 가동시켜 이미지 분석을 수행해야 하는데다가, 빛의 조건이나 촬영 각도에 따라 이미지가 크게 바뀌기 때문에 개체 인식이 어렵기 때문임


구글은 엣지 컴퓨팅을 위해 클라이언트에는 구글이 자체 개발한 이미지 처리 전용 AI 프로세서인 픽셀 비주얼 코어(Pixel Visual Core)’ 탑재를 권장사항으로 하고 있고, 클라우드 상의 AI 처리에는 클라우드 TPU(Cloud TPU)'를 사용하고 있음


구글 렌즈는 클라어언트에서 실시간으로 연속적인 이미지 분석을 수행하는 구조를 갖추고 있어 최고의 컴퓨터 비전이라 할 수 있지만, 단 프로세서에 높은 부하가 발생해 스마트폰의 발열이 심하고 20분 정도 계속하게 되면 배터리가 바닥나는 문제가 있음


구글에 따르면픽셀 비주얼 코어칩이 표준 프로세서보다 속도가 5배 빠르고 전력 소비량은 10분의 1에 불과한데, 그럼에도 불구하고 구글 렌즈의 연속 사용시간이 20분에 불과하다는 것임


바꿔 말해 픽셀 비주얼 코어를 탑재하지 않은 스마트폰이라면 배터리 소모가 더욱 심할 것이기 때문에, 비판적으로 본다면 구글 렌즈는 아직까지는 컨셉에 가깝고 실제 일상적인 스마트폰 기능으로 사용하기엔 아직 요원하다 말할 수도 있음


이는 스마트폰이라는 제한된 컴퓨터 처리 용량과 배터리 용량을 가진 디바이스를 AI 분석의 단말기로 사용하기 때문에 발생하는 것으로 현재로서는 어쩔 수 없는 문제이며, 향후 지속적으로 해결해야 할 과제임


◾ 구글 렌즈는 일종의 증강현실 기반 이미지 검색으로 구글의 핵심 사업인 검색 서비스 강화가 목적으로 보이며, 기술이 안정화된다면 새로운 구글링 도구로 일상에 자리 잡을 전망


구글은 지난 2010년 이미지 검색 스마트폰 앱인 구글 고글(Google Goggles)'을 선보인 바 있지만 폭넓게 확산되지는 못했음


구글 고글은 랜드마크, 도서, 주소록, 예술작품, 장소, 와인, 브랜드 로고 검색을 이미지 검색으로 수행한다는 컨셉으로, 구글 렌즈가 하려는 기능과 사실상 동일함


<자료> Kliker

[그림 7] 구글 고글의 이미지 검색 기능


구글 렌즈는 구글 고글의 후속 사업모델인 셈인데, 고급 AI를 구현하여 검색 정확도가 크게 향상되었기 때문에 구글은 사용 확산은 기대하고 있음


구글 어시스턴트는 단어 검색 질의뿐 아니라 비디오와 이미지 검색 기능 실행을 통해 검색의 폭을 크게 넓히려 하고 있는데, 구글 렌즈는 구글 어시스턴트를 통한 이미지 검색 질의 건수 증가에도 기여할 것으로 보임


이미지 검색의 정확도를 높이고, 그 결과를 전자상거래와 곧 바로 연결한다는 점에서 구글 렌즈는 구글의 핵심 비즈니스에 가장 부합하는 것이라 할 수 있음


사용시간 문제 등 아직은 일상화하기에 부적합한 면이 있지만 구글 렌즈는 다양한 용도로 활용이 가능하기 때문에, 구글링이 일상적 행위로 자리 잡은 것처럼 구글 렌징도 배터리 문제만 해결된다면 이용자들의 일상 속에 녹아들 것으로 전망되고 있음


※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1838호(2018. 3. 21. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

아마존과 구글의 스마트홈 경쟁, 거실 다음 격전지는 &lsquo;현관&rsquo;.pdf



ž 스마트홈 주도권 확보를 위한 아마존닷컴 구글의 싸움이 거실에서 현관으로 확산될 조짐을 보이고 있는데, 먼저 움직임을 보인 것은 구글 산하 네스트 랩스(Nest Labs)


Ø 양사는 거실 주도권을 놓고 이미 스마트 스피커와 스마트 TV 제품으로 격돌한 바 있으며, 이제 그 다음을 놓고 새로운 격돌을 준비하고 있는데 전장은 현관이 될 것으로 보임


Ø 미국에서는 원래 초인종 자체가 없는 집이 많았는데, 최근 몇 년 새 카메라 기반의 스마트 초인종 시장이 인기를 모으고 있음



Ø 스마트 초인종을 제조하는 스타트업이 잇따라 등장했을 뿐 아니라, 구글 산하의 네스트 랩스도 2017 10월에 시장 진출을 발표했으며, 올해 3월 초에 제품 출하를 시작하였음


Ø 네스트는 2014 6 보안 카메라 제조업체인 드롭캠(Dropcam)를 인수해 보안 카메라 시장에 진출했으며, 이후 이를 기반으로 201710월에 스마트 초인종 네스트 헬로(Nest Hello)를 발표하였음


<자료> Slash Gear


[그림 1] 네스트 랩스의 네스트 헬로


Ø 스마트 헬로 초인종은 스마트폰 앱과 클라우드 보안 서비스인 네스트 어웨어(Nest Aware)를 연계한 카메라 기반의 제품으로 가격은 229 달러임


ž 네스트 헬로는 이미지 인식 기능을 탑재하고 있으며, 구글의 음성인식 비서인 구글 어시스턴트와 연계되어 다양한 스마트 기능을 제공할 수 있음


Ø 방문객이 네스트 헬로 초인종을 누르면 사용자의 스마트폰에 알림이 통보되고, 사용자는 앱을 통해 방문자가 누구인지 확인하고 대화할 수 있음


Ø 네스트 헬로는 카메라로 촬영한 사진이나 동영상을 모두 클라우드 서비스에 보내고 이미지 인식에 의해 인물 식별을 수행하는데, 문 앞에 가족과 친구, 수상한 사람이 나타나면 이를 인식하여 사용자의 스마트폰에 알림 및 경고를 보냄


Ø 미국에서는 택배 기사가 화물을 문 앞에 두고 가는 경우가 적지 않고, 이를 노리는 좀도둑들도 많은데 네스트 헬로는 이미지 인식을 통해 처음 보는 수상한 사람이라고 판정하면 음성으로 경고를 내보냄


Ø 반대로 카메라에 등록된 얼굴로 파악한 경우에는 구글의 음성 비서 구글 어시스턴트(Google Assistant)가 방문자의 이름을 음성으로 사용자에게 알려줌


[1] 구글 네스트 랩스와 아마존의 스마트홈 보안 제품 관련 주요 동향

시기

업체

주요 동향

2014 6

네스트

- 보안 카메라 제조 업체 드롭캠(Dropcam) 인수. 후에 네스트 캠(Nest Cam)으로 개칭

2015 10

네스트

- 스마트 락 제조업체 예일(Yale)과 제휴

2017 9

네스트

- 스마트 초인종 네스트 헬로(Nest Hell)와 보안 시스템 네스트 시큐어(Nest Secure) 발표

2017 10

아마존

- 보안 카메라 아마존 클라우드 캠(Amazon Cloud Cam)과 부재 중 댁내 택배 배달 서비스 아마존 키(Amazon Key) 발표

2017 12

아마존

- 스마트 초인종 스타트업 블링크(Blink) 인수

2018 1

네스트

- 예일의 네스트 예일 록(Nest Yale Lock) 인수, 2018 1분기 출하 계획 발표

2018 2

아마존

- 스마트 초인종 스타트업 링(Ring) 인수

<자료> IITP 정리


ž 이러한 구글의 움직임에 아마존도 정면으로 대응하고 나섰는데, 최근 들어 스마트 초인종 스타트업 두 곳을 연이어 인수하였음


Ø 아마존은 2017 10월 보안 카메라 아마존 클라우드 캠(Amazon Cloud Cam)을 발표함과 동시에 아마존 쇼핑몰의 배달원이 주문자가 부재한 빈 집의 스마트 잠금을 해제하고 집 안에 들어가 택배를 전달할 수 있게 하는 아마존 키(Amazon Key) 서비스도 시작하였음


<자료> Amazon.com


[동영상] 아마존 키 서비스 이용 장면


Ø 아마존 클라우드 캠 서비스는 배달원은 전용 앱을 이용해 스마트 잠금을 해제 할 수 있고, 사용자는 빈 집에 들어간 배달원을 모니터링 할 수 있게 해 줌


Ø 아마존은 최근 들어 카메라 초인종 제조 업체를 연이어 사들였는데, 2017 12월에는 블링크(Blink), 2018 2월에는 (Ring)을 인수하였음


Ø 먼저 인수한 블링크는 2009년에 설립된 보안 카메라 기업으로 2018년에 카메라 기반 스마트 초인종을 출시할 예정임


Ø 올해 2월에 인수한 링은 이미 카메라 초인종을 판매하고 있는 기업으로, 보도에 따르면 링의 인수 금액은 10억 달러에 이른다고 함


ž 아마존과 구글 양사는 최근 AI(인공지능) 스피커를 스마트홈의 허브로 자리매김하고, 자신들의 AI 비서 및 클라우드 서비스와 연계되는 가전 제품을 늘리려 애쓰고 있음


Ø 이런 경쟁 구도 하에서 스마트 스피커, 스마트 TV에 이어 보안 카메라와 카메라 초인종 등 스마트홈 보안 제품은 아마존과 구글이 맞대결하는 새로운 가전 제품이 되었음


Ø 구글은 네스트 헬로를 예약 주문한 사람에게 49 달러 상당의 소형 스마트 스피커 구글홈 미니(Google Home Mini)를 무료로 번들하는 캠페인을 전개하고 있음


Ø 네스트 헬로는 네스트 어웨어와 구글 어시스턴트가 연계되어 있으므로, 스마트폰이 없더라도 구글 어시스턴트를 이용할 수 있도록 구글홈 미니를 번들한 것임


Ø 구글은 네스트 시큐어 카메라와 구글 어시스턴트, 나아가 스마트 TV 단말기인 크롬캐스트(Chromecast)를 연계시키는 구조도 준비하고 있음


Ø 가령 사용자가 구글 어시스턴트에, 좋아 구글, 카메라의 영상을 비춰 줘라고 말을 건네면, 보안 카메라가 촬영한 라이브 동영상을 크롬캐스트에 연결된 TV에 표시해 주는 것임.


Ø 이러한 연계 구상은 아마존 클라우드 캠과 아마존의 AI 비서인 알렉사(Alexa), 그리고 스마트 TV 단말기인 아마존 파이어 TV(Amazon Fire TV)로도 실현할 수 있음


Ø 아마존 역시 구글의 네스트 어웨어에 대항하는 클라우드 보안 서비스 클라우드 캠 서브스크립션을 제공하고 있으며, 클라우드 기반의 이미지 인식 기술에 의한 인물 특정 기능 등도 제공하고 있음


ž 양사의 경쟁에서 향후 관전 포인트는 스마트 락(Smart Lock)인데, 사실 보안 카메라와 스마트 락의 연계 구상을 먼저 발표한 것은 구글이지만 실현은 아마존이 빨랐기 때문


Ø 구글은 2015년에 미국의 오래된 자물쇠 제조업체 예일(Yale)과 제휴하고, 예일의 스마트 락을 네스트 시큐어 카메라와 연계시킬 계획임을 발표했으나 구현에 어려움을 겪었고, 예일의 네스트 지원 스마트 락 판매는 2018 1분기 내로만 알려져 있음


Ø 이에 비해 아마존은 2017 10월 아마존 키 서비스를 시작한 시점에, 예일과 유사한 미국의 오랜 자물쇠 제조업체 퀵 세트(Kwikset)가 판매하는 스마트 락과 아마존 클라우드 캠의 연계를 구현했는데, 후발주자인 아마존이 실행력에서 구글을 앞선 것임


Ø 게다가 스마트 락의 기능 면에서도 아마존이 구글을 크게 앞선다는 평가인데, 아마존 키와 같은 기능의 서비스를 구글은 아직까지 제공하지 못하고 있기 때문


Ø 아마존은 아마존 키 서비스를 플랫폼으로 성장시킨다는 복안인데, 아마존닷컴 쇼핑몰의 제품 배달원뿐만 아니라 홈 클리닝 서비스 등 다른 직종의 서비스 직원들도 아마존 키 방식을 이용하여 고객의 빈 집에 들어갈 수 있게 하겠다는 계획을 밝힌 바 있음


Ø 홈 시큐리티 제품은 보안을 위한 필수 요소이며, 재산상 및 신체상, 정신적인 피해를 막을 수 있는 대신 편의성을 높이는 것은 어려운 일이었음


Ø 아마존 키 서비스는 홈 시큐리티 제품에 편의성을 향상시킨 것으로, 지금까지 홈 시큐리티 제품에 관심이 없었던 사용자의 구매욕을 자극하고 있는데, 이는 홈 시큐리티 분야에는 아직 후발주자들에게 충분한 기회가 있음을 시사


ž 한편 네스트의 주종목인 스마트 온도계 분야에서도 아마존과의 정면 대결이 조만간 시작될 것으로 보여, 스마트홈을 둘러싼 구글과 아마존의 경쟁은 더욱 가열될 전망


Ø CNBC에 따르면 아마존은 3 7일 산하의 알렉사 펀드(Alexa Fund)를 통해 캐나다의 스마트 온도계 제조업체 에코비(Ecobee)에 투자하였음


Ø 스마트 온도계는 가령 에어컨과 연계하여 사용자가 음성으로 에어컨을 제어 할 수 있도록 하고, 기계학습에 의해 사용자의 실온 취향 등을 학습할 수 있게 한 것임


Ø 보도에 따르면 이번 에코비 투자 즈음에 아마존은 자사 쇼핑몰 사이트에서의 네스트의 스마트 온돈계 판매를 중단했는데, 아마존과 구글의 스마트홈 경쟁이 점차 과열 양상을 띨 조짐이 보이고 있음

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1830호(2018. 1. 24. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

&lsquo;아직 집에 대해 잘 모른다&rsquo;, 구글이 말하는 스마트 스피커의 과제.pdf



ž 구글은 올해 CES에서 최초로 자사의 부스를 마련했는데, 스마트 시티와 자율주행차가 테마였던 2018 CES에 구글이 내세운 제품은 인공지능(AI) 기반 스마트 스피커였음


<자료> 9to5 Google


[그림 1] 2018 CES를 뒤덮은 구글의 광고


Ø 구글은 라스베이거스 시내와 CES 행사장인 라스베이거스 컨벤션센터(LVCC)를 오가는 모노레일의 외관과 도심 곳곳의 전광판을 구글의 AI 음성 비서인 구글 어시스턴트를 호출할 때 쓰는 말인 헤이 구글(Hey Google)로 뒤덮었음


Ø 이는 구글이 이번 CES에 부스를 차린 목적이 AI 기반 스마트 스피커를 홍보하고, 스마트 스피커 시장 점유율 67%를 차지하는 아마존에 도전장을 내밀기 위한 것임을 보여 줌


Ø 구글이 작년 10월 출시한 AI 스피커 제품 구글홈 미니(Google Home Mini) 모델은 1월 첫 주까지 총 673만 대 출하되었는데, 이는 11월 말 추수감사절 이후 구글홈 미니 가격을 49달러에서 29달러로 내림에 따라 수요가 급증했기 때문


Ø 이와 동시에 12월에는 프리미엄 스마트 스피커를 표방한 구글홈 맥스(Max) 모델을 399달러에 내놨는데, 구글홈 맥스는 식기세척기가 돌아가면 자동으로 볼륨을 높이는 등 주변 환경에 따라 스스로 음량과 음색을 바꾸는 기능을 탑재하고 있음


ž 구글의 스마트 홈 제품 책임자인 마크 스페이츠는 CES의 토크 세션에 참여해 구글 어시스턴트와 스마트 스피커의 과거와 현재, 그리고 미래에 대한 의견을 밝혔음


Ø 토크 세션의 제목은 음성 제어: 스마트 홈 경험의 개선이었는데, 이 토론에는 인텔의 스마트 홈 그룹 제네럴 매니저인 마일즈 킹스턴, 삼성전자의 서비스 및 신규사업 부사장이나 제너럴 매니저인 나나 무루게산 등이 함께 패널로 참석하였음


Ø 스페이츠는 스마트 스피커인 구글홈을 개발하기 위해 우선 집을 아는 것에서부터 시작했다고 말했는데, 스마트 스피커에 무슨 일을 시킬 것인지가 아니라 무슨 기능이 필요한 지를 생각했을 때 개발팀 중 아무도 에 대해 제대로 아는 사람이 없다는 것을 깨닫게 되었다고 함


Ø 스페이츠는 스마트 스피커가 아직 완성도가 높은 제품이 아니라고 평가했는데, 토론에 참여한 다른 패널들도 아마존닷컴에 이어 구글 등이 잇따라 스마트 스피커를 출시하고 있지만 이 시장은 아직 초기단계라는 점을 강조하였음.


Ø 삼성전자의 무루게산 부사장은 스피커가 이해력(intelligent)은 있지만 경험에 기반한 현명함(wise)이 있지는 않다며, 현명해지기 위해서는 인간과 더 많은 관계가 필요하다고 말했음


Ø 스마트 스피커와 대화의 시작을 위해 헤이 구글'과 같은 말을 사용하지 않으면 안 되는 것도 아직 어색한 지점이라는 지적도 있었음


ž 패널들 중에는 스마트 스피커가 향후 디스플레이와 조합에 의해 더 발전해 나갈 것이라는 의견을 제시한 사람이 많았음



Ø 실제 올해 CES에서는 스마트 디스플레이 관련 기술에 대한 관심이 높았는데, 소니, 삼성전자 산하의 JBL, LG전자, 레노버 등이 구글 어시스턴트를 지원하는 제품을 발표하였음


Ø 스페이츠 역시 스마트 스피커를 주방에 두는 경우를 예로 들며, 음성으로 타이머 기능을 이용하는 것은 좋지만 스피커가 레시피를 음성으로 읽어 주는 방식은 좀 곤란하다고 지적


Ø 캘린더 기능에 대해서도, 오늘의 날씨 정도를 듣는 것은 상관 없지만, 스피커가 읽어 주는 모든 일정의 내용을 듣고 있는 것은 고역이라며, 구글 어시스턴트와 디스플레이의 조합을 통해 편의성이 개선될 수 있을 것으로 전망했음


<자료> Digital Trends


[그림 2] 레노버의 스마트 디스플레이


ž 마크 스페이츠가 향후 스마트 스피커의 과제로 제시한 것은 대화 기능다양한 가족 구성원들이 익숙하게 사용하기


Ø 대화란 어떤 질문에 대해 답하고 그 대답에 반응하여 이야기가 이어지는 것인데, 이런 의미에서 스마트 스피커는 아직 대화를 할 수 있는 수준은 아니라는 게 스페이츠의 의견이며, 질문을 할 경우에만 응답하는 방식의 일방통행적 커뮤니케이션은 아직 대화가 아니라는 평


Ø 또 다른 과제로는, 세대와 관심 범위, 기술에 대한 이해도가 각기 다른 가족 구성원들이 어떻게 스마트 스피커 사용에 익숙하게 할 수 있는가를 꼽았음


Ø 스페이츠는 어떤 활용 예(Use Case)를 상상하느냐에 달려 있다고 말하며 두 가지 예를 언급했는데, 첫번째는 구글이 실시한 프로모션 사례로, 오케이 구글, 크리스마스 트리에 불을 켜라고 명령하는 동영상 광고를 내보내자 많은 사람들이 방법을 배워 그대로 따라 했다고 함



Ø 이는 어떤 활용 예가 있을 수 있는지 상상해 보고 실제로 보여주는 것이 중요함을 보여주는데, 상상할 수 있으려면 에 대해 더 깊이 아는 것이 중요하다고 스페이츠는 지적함


Ø 집에 대해 잘 알아야 어떤 상황에 스마트 스피커를 사용하는 것이 좋은 활용사례가 될 수 있는지를 이해할 수 있기 때문인데, 올바른 방법으로 올바른 타이밍에 음성 UI를 사용할 수 있게 된다면 스마트 스피커는 다음 단계로 올라설 수 있을 것임


Ø 또 다른 예로는, 나이 드신 어머니와 연락이 되지 않아 무슨 일이 벌어졌는지 걱정한 이후로 모든 방에 구글홈을 설치한 사람의 사례를 들었음


Ø 이 사람은 어머니에게 어느 방에서도 노래를 들을 수 있게 하려 그런다는 식으로 설명했으며, 구글홈의 설정에 뭔가 수정이 발생하면 바로 자신에게 연락이 오도록 해두었다고 함


Ø 스페이츠는 아무도 스마트 하우스를 샀다!’는 식으로 말하지 않는다며, 소비자들이 자신의 집에 기술을 접목함으로써 얼마나 편리하게 되는가를 자연스럽게 이해할 수 있도록 하는 것이 향후 스마트 스피커 시장 확대에 기여할 것이라 강조했음

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1821호(2017. 11. 8. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

도쿄 모터쇼에 비친 일본 자동차 업계의 스마트 IT 접목 현황.pdf



[ 요 약 ]


도쿄 모터쇼가 한동안 중국의 모터쇼에 밀리는 통에 일본 자동차 업계의 영향력이 많이 줄어든 것처럼 보였으나올해 일본 자동차 업계는 세계 시장에서 역대급 실적을 달성하고 있으며 이에 따라 올해 도쿄 모터쇼에는 예전에 비해 많은 관심이 모였음일본은 그 동안 스마트 IT의 도입에 뒤쳐진다는 인상이 있었으나이번 도쿄 모터쇼에서는 자율운전과 AI 외에도 자동차에 IT를 다양하게 접목하려는 시도가 다수 선보이며 스마트 카 시대에도 일본차의 경쟁력이 이어질 수 있음을 시사



[ 본 문 ]


ž 최근 일본 자동차들은 3대 시장에서 큰 성과를 거두며 과거의 영광을 재현하고 있는데, 10월 말 개최된 도쿄 모터쇼는 일본차들의 저력을 다시 한번 확인시켜 주었음


Ø 원래 도쿄 모터쇼는 프랑크푸르트, 디트로이트, 파리, 제네바 모터쇼와 함께 세계 5대 모터쇼로 꼽혔으나 거대 내수 시장을 등에 없고 밀어 부치는 상하이와 베이징 모터쇼에 밀리면서 어느 순간 관심 밖으로 밀려나 있었음


Ø 올해도 세계 자동차 시장의 신성 테슬라를 비롯해 미국 완성차 업체들이 불참을 통보했고, 닛산에 이어 스바루 역시 자동차 검사원 자격이 없는 사람을 서류 조작해 완성차 출고 전 검사를 시켰다는 사실이 도쿄 모터쇼 당일 언론에 보도되며 큰 소동이 있었음


Ø 앞서 10월 중순에 고베 제강이 10년 전부터 데이터 조작을 통해 고객이 요구하는 수준을 밑도는 제품을 출시한 것이 밝혀져 큰 충격을 준 바 있는데, 고베 제강의 6천여 개가 넘는 고객 중에는 다수의 자동차 관련 기업들도 포함돼 있어 일본차의 신뢰에 큰 금이 가게 만들었음


Ø 그러나 겉으로 드러난 악재와 달리 일본차들은 서유럽, 미국, 중국 등 3대 자동차 시장에서 성장을 이어가고 있는데, 서유럽에서 올해 일본차들의 점유율은 전년 대비 2.3% 포인트 늘어난 14.8%로 나타났고, 미국 시장 점유율 역시 역대 최고치인 40%대를 기록할 것으로 보임


Ø 중국에서도 2015년부터 3년 연속 두자릿 수 성장세를 기록하는 등, 일본 자동차 업계의 강세가 지속되고 있는데, 이번 도쿄 모터쇼에서는 이런 일본 자동차 업계의 저력을 다시 한번 확인할 수 있었다는 평가가 외신들로부터 흘러 나왔음


ž 특히 인공지능(AI) 기반의 음성 인터페이스와 자율운전 등 자동차 산업과 IT의 관계가 일본차들에서도 더욱 밀접해지고 있음을 보여주는 전시가 모터쇼의 핵심을 이루었음


<자료> Toyota


[그림 1] 도요타의 컨셉트 카 컨셉트-I


Ø 도요타 자동차는 음성 인식, 표정 분석, 자율운전 등 AI 기능을 구현하여 드라이버를 지원하는 컨셉트 카 ‘‘컨셉트-아이아이(Concept-i)를 선보이고, 부스에서 관람객이 AI에 의한 운전 지원 기능을 체험 할 수 있는 데모를 제공하였음


Ø 데모는 미국 샌프란시스코 근교를 드라이브 한다는 가정 하에, AI 에이전트와 음성 대화하면서 목적지로 향하는 것을 체험하는 것인데, 에이전트는 자동차를 타는 빈도나 휴일의 라이프스타일 등 관람객에게 사전 질문해 받은 응답을 토대로 드라이브의 목적지를 제안하였음


Ø 에이전트는 목적지에 대한 자세한 정보와 날씨, 소요 시간, 경로의 정체 여부 등을 운전자와 대화를 통해 안내하고, AI의 대답에 대한 운전자의 표정에서 감정을 읽어 운전자가 즐거운 표정을 하고 있다고 판단하면 보다 자세히 설명을 이어감


<자료> Toyota


[그림 2] 도요타의 운전자 감정 분석 기능


Ø 에이전트는 자율운전과 수동 운전을 여러 단계로 전환하고 전방에 위험이 감지하면 자동으로 정지하며, 운전 중 운전자의 표정을 카메라로 분석하여 목적지에 도착 후 가장 즐거워한 지점과 기장 놀랐던 지점을 알려주는 등의 기능을 안내하는 등의 기능도 체험하게 해주었음


Ø 도요타는 2020년경에 컨셉트-아이아이의 일부 기능을 도로에서 실증 실험을 할 계획임


Ø 도요타 렉서스는 인공지능을 장착한 완전 자율주행 컨셉트 카 LS+를 공개했는데, 하이웨이 팀메이트(Highway Teammate)라 이름을 붙인 AI가 운전자와 대화를 통해 주행 방식을 결정하는 모습을 시연하였음


Ø LS+ AI는 예를 들어, 앞차와 거리를 얼마나 유지할까요 또는 차선을 변경해 앞차를 추월할까요와 같은 질문을 운전자에게 던져 차량의 운행 방식을 이용자 뜻에 맡게 조절하였음


Ø 이 밖에 도요타는 수소 연료전지자동차(FCV)의 컨셉트 카인 파인 컴포트 라이드(Fine-Comfort Ride)를 최초로 공개했는데, 한번 주유로 약 1300km를 주행하는 프리우스처럼 파인 컴포트 라이드 역시 한번 충전으로 1000km 주행을 목표로 한다고 밝힘


ž 도요타가 컨셉트 카의 기술에 대한 자세한 내용을 밝히고 있지 않지만, 도요타의 비전을 뒷받침할 기술들은 미쯔비시 전기의 부스에서 전시되었음


Ø 미쯔비시 전기 역시 도요타와 마찬가지로 운전석에 장착된 카메라로 운전자의 감정을 식별하고 AI를 통해 음성 대화하는 드라이버 모니터링 시스템을 전시하였음


Ø 운전석에 앉은 운전자에 대한 기록이 있으면 AI는 그 이름을 불러 주고 운전자의 취향에 맞는 음악을 재생하는 등의 동작이 가능하며, 처음 탑승한 운전자라면 이름이 무엇인지 묻거나 차내의 기기 장치에 대한 설명을 자세히 하는 등 행동 방식을 바꾸게 됨


Ø 얼굴뿐만 아니라 손의 움직임도 인식하기 때문에, 가령 손을 들어 음악의 일시정지를 명령하는 등 버튼을 누르지 않고 다양한 작업을 할 수 있다고 하는데, 미쯔비시는 이 기술을 2018년에 실용화 할 방침이라고 함


Ø 미쯔비시는 또한 자사 내비게이션의 음성인식 기술도 시연했는데, 자체 개발한 환경음의 캔슬링 기능은 내비게이션이 음성 안내를 하고 있는 도중에 끝나기를 기다리지 않고 도쿄 타워 근처의 편의점'과 같이 명령하면 안내를 멈추고 다음 단계로 진행되는 것이 특징임


Ø 미쯔비시의 내비게이션은 2016년 모델부터 이 기능을 도입하고 있지만, 2018년식 모델부터는 클라우드 서버와 연계된 음성 인식 기술을 제공하여 인식할 수 있는 어휘 수나 인식 정확도를 높인다는 계획임


ž 미쯔비시 자동차는 아마존의 인공지능 스피커 아마존 에코(Echo)와 구글의 인공지능 스피커 구글 홈(Google Home)에서 자동차를 원격 제어하는 ​​데모를 전시하였음


Ø 에코와 구글홈에 각각 사용된 에이전트인 아마존 알렉사(Alexa)구글 어시스턴트(Assistant)를 통해 미쯔비시의 텔리매틱스 서비스인 미쯔비시 커넥트(MITSUBISHI CONNECT)에 접속하여 잠금 및 해제, 헤드램프의 점등과 소등, 차내 온도 조정, 엔진의 시동 등을 구현하였음


Ø 미쯔비시 자동차는 이번 데모에서는 AI 스피커를 사용했지만 실용화 단계에서는 차량의 스피커와 마이크를 사용하거나 운전자가 스마트폰의 AI 에이전트 앱에 음성 명령으로 원격 조작하는 방식을 우선 고려하고 있다며, 미국에서는 2018년부터 서비스를 제공할 계획이라 밝힘


ž 후지쯔 텐은 운행 기록 기기(드라이브 레코더, drive recorder)의 기능을 고도화하여 안전 운전과 교통 체증 해소를 위한 정보를 제공하기 위한 최신 기술을 선보였음


Ø 후지쯔 텐은 법인 소유 영업 차량 및 운송 차량 등을 위한 드라이브 레코더의 새로운 기능을 시연했는데, 카메라 영상이나 GPS 위치 정보 등을 바탕으로 데이터를 수집하여 빅데이터 분석을 통해 급브레이크 등 돌발사고 발생 지점의 특성을 분석하는 기능을 새롭게 개발하였음


Ø 관리자용 PC 화면에서는 지도 상의 핀 표시를 통해 돌발 사고 발생 지점을 확인할 수 있도록 했는데, 운전자의 성별, 나이, 면허 종류, 사고 발생 시간과 날씨 등을 기초로 가령 초보자 면허 20대 남성 운전자에게 저녁에 돌발사고가 발생하기 쉬운 장소를 확인할 수 있음


Ø 또한 후지쯔 텐은 드라이브 레코더가 촬영한 돌발 사고 발생 시의 영상을 CG 화하여 PC 화면에서 재생할 수 있는 기능을 제공할 예정이라 밝혔음



<자료> Fujitsu TEN


[그림 3] 후지쯔 텐의 드라이브 레코더 수집 데이터()와 관리자용 화면(아래)


Ø 이는 서비스 이용 계약을 맺은 어떤 기업의 차량에서 촬영한 영상을 그대로 다른 이용 계약 업체에 제공할 수는 없지만, CG화를 통해 다른 기업의 차량이 조우한 제공하여 참고할 수 있도록 하기 위한 것인데, 구체적 시기는 밝히지 않았지만 조만간 본격 제공할 것이라고 함


ž 도요타 역시 도쿄 근교를 운행하는 택시 500 대의 드라이브 레코더 영상과 차량 네트워크 (CAN)에서 획득한 실시간 주행 데이터를 지도로 표시해 주는 솔루션을 전시하였음


Ø 주행 속도를 포함한 주행 데이터를 1초 단위로 획득(서버 전송은 1분 단위)하는 동시에 드라이브 레코더의 영상을 분석하여 개별 택시가 주행 중인 차선을 식별하고 있는데, 이는 도로 단위뿐 아니라 차선 단위로 세분화하여 정체 정보를 실시간으로 생성, 전달하기 위한 것임


Ø 도요타는 2018년 봄을 목표로 일부 교차로에서 차선 단위의 정체 정보를 스마트폰 앱을 통해 제공하는 서비스 제공을 준비하고 있음


ž 이 밖에 최근 이슈가 되고 있는 개인 간 자동차 공유 및 수취자 부재 시 택배의 배달 문제와 관련된 전시도 있었음.


Ø 도요타는 자동차 키 대신 스마트폰 앱을 이용하여 잠금과 해제 및 엔진 시동 걸기를 가능하게 해주는 자동차 모듈 스마트 키 박스를 전시하였음


Ø 이 모듈은 가령 개인 간의 차량 공유 서비스에서 결제를 마친 이용 예정자에게 소정의 기간 동안에만 유효한 논리적 키를 발행하는 데 사용할 수 있음


Ø 또한 인터넷 쇼핑몰에서 구매한 상품이 배송되었으나 집에 없을 경우, 집 근처에 차량이 주차되어 있다면 트렁크 문만 열 수 있는 유효한 키를 택배업체 기사용으로 발행하는 등의 이용 방법을 상정하고 있는데, 미국에서는 이미 실증 실험을 시작했다고 함


ž 올해 도쿄 모터쇼는 그 동안 잘 부각되지 않았으나 일본 자동차 업계 역시 자율주행 등 자동차의 스마트 기기화 흐름에 뒤쳐지지 않고 있음을 확인시켜주는 자리였음


Ø 구글, 테슬라, 우버 등 그 동안 자동차의 IT화는 자율주행 및 AI 기술에 강점을 가진 미국의 IT 기업들이 주도해 왔으며, 세계 자동차 업계에 나름의 지분을 가지고 있는 일본 업체들의 IT 수용 노력은 상대적으로 덜 알려지거나 폄하되어 온 측면이 있음



Ø 그러나 고베 제강 비리나 무자격자 심사 사건 등 뒤숭숭한 분위기 속에 치러진 도쿄 모터쇼는 일본 자동차 업계가 그 동안의 평가와 달리 스마트 IT 시대에도 뒤쳐지지 않을 경쟁력을 갖추기 위해 상당한 노력을 해왔음을 보여 주며 앞으로도 선전할 가능성이 있음을 입증하였음


Ø 스마트 IT 시대를 맞이해 일본 자동차 업체들은 연비가 아닌 공간에 주력하는 하는 모습을 보였는데, 가령 도요타는 자동차를 넘어 사람의 이동을 돕는 기업으로라는 슬로건에 맞게 자율주행 시대에 중요해진 차량 내부 공간 설계에 초점을 두는 철학을 보여주었음


Ø 혼다 역시 과거와 미래가 공존하는 디자인이란 호평을 받은 전기차(EV) 어반(Urban)을 최초로 공개했는데, 미래지향적 디자인과 컴팩트한 차량 사이즈는 운전 욕구를 불러일으키며 운전을 기피하는 젊은 세대들에게 주행의 즐거움을 선사할 수 있겠다는 평가를 이끌어 냈음


<자료> Honda


[그림 4] 혼다의 EV 컨셉트 카 어반(Urban)


Ø 메이드 인 재팬 신화를 이룬 일본 자동차 업계가 IT 접목에도 상당한 성과를 이어가게 된다면, 테슬라 등 IT 기반의 파괴적 혁신 기업들과 경쟁을 통해 차세대 스마트 기기로서 자동차의 기능은 더욱 높은 수준을 향해 발전해 나갈 것으로 기대됨


※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1818호(2017. 10. 18. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

구글 하드웨어 신제품 발표, 제품 차별화 요소는 &lsquo;AI 최적화&rsquo;.pdf



[ 요 약 ]


구글이 작년에 이어 메이드 바이 구글(Made by Google) 행사를 통해 신제품을 대거 공개했는데올해 신제품 발표회의 테마는 하드웨어와 소프트웨어그 중에서도 인공지능(AI)의 통합이었음구글은 이번 신제품에 최신 AI 기술의 성과를 광범위하게 적용하며향후 AI가 기기 차별화의 결정적 요인이 될 것으로 바라보고 있음을 드러냈음스마트 기기의 하드웨어 차별성이 점차 엷어지는 가운데소프트웨어 최적화를 넘어선 AI 최적화가 제품 경쟁의 새로운 화두가 될 것으로 예상됨



[ 본 문 ]


ž 작년 10메이드 바이 구글(Made by Google) 하드웨어 신제품 5개를 일거에 출시했던 구글이 1년 만에 다시 신제품을 대거 발표하였음


Ø 이번에 발표한 신제품은 작년에 출시된 제품의 업그레이드 버전도 있지만, 구글로서는 새롭게 시도하는 제품들도 포함되어 있음


<자료> Google

[그림 1] Made by Google 2017


Ø 작년에 선보인 구글 자체 스마트폰 픽셀(Pixel)의 후속 버전으로 픽셀 2가 발표됐으며, 역시 작년에 선보인 인공지능(AI) 스피커 구글 홈(Google Home)은 이번에 구글홈 미니(Mini)구글홈 맥스(max)로 라인업이 확대되었음


Ø 올해 새롭게 선보인 제품으로는 액션 카메라인 구글 클립스(Google Clips)와 음악 재생 및 외국어 번역에 사용하는 블루투스 헤드셋 구글 픽셀 버즈(Google Pixel Buds), 그리고 크롬북의 상위 버전이라 할 수 있는 노트북 픽셀북(PIxelbook)이 있음


Ø 작년 10월에 이어 1년 만에 다시 하드웨어 발표회를 개최함으로써 향후 구글이 5월에 개최되는 연례 개발자 컨퍼런스 구글 I/O에 이어 10월의 신제품 발표회를 연례 행사화 할 가능성도 점쳐지고 있음


ž 이번 신제품 발표회의 테마는 하드웨어에 소프트웨어와 인공지능(AI)을 통합하는 것으로, 구글이 AI를 제품 차별화의 결정적 요인으로 바라보고 있음을 드러냄


Ø 구글홈 미니는 아마존의 소형 AI 스피커인 에코닷(Echo Dot)의 대항마 성격으로, 가격은 49 달러이지만 AI 가상비서 기능인 구글 어시스턴트(Google Assistant)가 탑재되어 있음


Ø 미니는 도넛 크기의 타원형 형상으로 상단에 LED가 탑재되어 기기 상태를 표시해주는데, 에코닷과 마찬가지로 가정 내 각 방에 하나씩 놓고 사용하는 것을 전제로 디자인 한 것으로 보이며, 구글이 집 전체 공간을 AI로 채우고 싶어함을 유추할 수 있음


Ø 맥스는 음질을 중요한 모델인 동시에 구글이 400 달러인 가격에 걸맞게 구글홈보다 20배 정도 성능이 강력하다고 소개할 정도로 AI 기반의 사운드 재생 기능이 뛰어난 기기임


Ø 2개의 4.5인치 우퍼를 내장해 깊이 있는 사운드 재생이 가능하며, 스마트 사운드(Smart Sound) 기능을 탑재하고 있어 주변 환경과 사용자의 컨텍스트에 맞게 음악을 재생할 수 있음



<자료> Google


[그림 2] 구글홈 미니(Mini)와 맥스(Max)


Ø 구글은 스마트 사운드 기능의 예로 AI가 방의 모양을 파악해 그에 적합한 사운드를 재생하거나, 아침 시간에는 볼륨을 좀 낮추어 재생하고 식기 세척기가 가동 중이어서 시끄러울 때는 볼륨을 높여 음악을 재생하는 것 등이 가능하다고 설명하고 있음


Ø 픽셀 2 스마트폰에는 지난 5월 구글 I/O에서 소개한 구글 렌즈(Google Lens) 기능이 처음으로 적용되었는데, 구글 렌즈는 구글 어시스턴트를 기반으로 렌즈에 비친 사물에 대한 정보를 불러들인 후 사진에 담긴 물체나 글자를 인식해 알려주는 AI 카메라임


Ø 픽셀북은 노트북과 태블릿 PC를 결합한 것으로 역시 구글 어시스턴트가 적용되어 있으며, 가령 픽셀북 펜을 이용해 디스플레이 화면 안의 특정 부분에 원을 그리면 구글 검색 엔진이 그 원안의 물체를 인식하고 관련된 정보를 검색해 줌


ž 구글이 AI를 신제품의 차별화 요소로 삼는 이유는, AI가 비단 구글의 하드웨어 신제품뿐 아니라 스마트 홈 생태계의 허브 기능을 담당할 것으로 보기 때문임


Ø 구글홈의 핵심 기능인 구글 어시스턴트는 스마트폰(안드로이드와 iOS), 스마트 워치(안드로이드 웨어), 텔레비전(안드로이드 TV) 등과도 연계할 수 있으며, 가상 비서의 인터페이스는 급속하게 음성으로 전환하고 있음


Ø 구글 어시스턴트는 생태계를 급속히 확장하고 있는데, 현재 스마트 홈 관련 기업 네스트(Nest), 필립스(Philips), 스마트씽스(SmartThings) 등이 내놓은 1천여 제품과도 연계가 가능함


Ø 특히 알파벳 산하의 네스트와 구글홈의 연계가 더욱 강화되고 있는데, 이번 기능 업그레이드로 네스트의 보안 카메라인 네스트 캠(Nest Cam)을 구글홈에서 조작할 수 있게 되었음


<자료> Google


[그림 3] 구글홈과 네스트 캠의 연계


Ø 이로써 가령 현관에서 무슨 소리가 나는 것 같을 때 구글홈에게 현관 앞 상황을 TV로 보여줘라고 명령하면, 구글홈이 네스트 캠에 찍힌 영상을 TV로 디스플레이 하는 것이 가능해졌음


Ø 또한 네스트의 스마트 초인종인 네스트 헬로(Nest Hello)도 구글홈에서 조작할 수 있게 되었는데, 네스트 헬로는 얼굴 인식 기능으로 방문자를 식별할 수 있는 친숙한 얼굴(Familiar Faces)라는 기능을 탑재하고 있음


Ø 따라서 누군가 초인종을 누르면 네스트 헬로가 그 인물을 인식해 구글홈에 알려주고, 구글홈이 이용자에게 방문자의 이름을 알려주는 것이 가능하며, 이런 기능을 활용해 네스트와 연계한 주택의 보안을 구글홈에서 집중 관리하는 것이 가능함


Ø 구글 어시스턴트가 허브가 되는 스마트 홈은 개인화 서비스도 가능한데, 보이스 매치(Voice Match) 기능을 통해 동시에 여섯 명의 목소리를 구분해 알아 듣고 개별 대응이 가능하기 때문


Ø 개인 맞춤형 서비스의 예로 이번 신제품 발표회에서는 에브리데이 루틴(Everyday Routines) 기능이 소개되었는데, 이는 한 단어만 듣고 그 사람과 관련된 여러 가지 명령을 동시에 실행하는 것으로 구글의 지향점을 잘 보여주고 있음


Ø 가령 식구들 중 회사로 출근을 해야 하는 사람이 있을 경우, 이 사람이 아침에 일어나 좋은 아침이라고 한 마디만 하면, 구글홈이 그의 하루 일정을 확인하고 일정에 따른 이동 경로의 도로 정체 정보를 알려주며 주요 뉴스를 읽어주도록 설정할 수 있음


Ø 또한 아이들이 구글홈에게 우리 게임하자라고 말을 할 경우, 아이들의 목소리를 인식하여 아이들이 안전하게 즐길 수 있는 게임을 실행하도록 설정할 수도 있음


ž 구글은 AI가 스마트 홈의 허브로 선택될 수 있도록 인간 친화적인 특성을 띠게 하는 데도 공을 들였는데, 여기에는 딥마인드(DeepMind)의 새로운 음성합성 기술이 기여를 하였음


Ø 구글홈의 음성 발화는 고급 AI가 적용되어 매우 매끄럽게 들리는데, 여기에는 딥마인드가 지난해 발표한 새로운 음성 합성(Speech Synthesis) 기술이 관여되어 있음


Ø 딥마인드가 새롭게 발표한 웨이브넷(WaveNet)은 심층신경망(Deep Neural Network)을 이용해 기계음이 인간에 가깝게 자연스럽게 발성할 수 있게 해주는 음성 합성 기술임


Ø 일반적으로 음성 합성은 말을 아주 작은 단위로 나눈 다음 필요한 음운, 음소, 단어에 맞게 조립하는 음성 연결 합성(Concatenative TTS)이라는 기법 사용하는데, 이 때문에 기계음은 말 그대로 기계적이고 어색한 톤으로 발화가 됨


Ø 딥마인드는 기존의 방식과 전혀 다른 접근 방식을 취했는데, 웨이브넷은 많은 수의 음성 샘플을 배우고 음성 파형(Audio Waveform)을 잘게 세분화 해 분석함으로써 음성 만으로는 알 수 없었던 숨 고르기나 단어 혹은 문장끼리 합쳐지는 방식까지 이해가 가능하게 하였음


Ø 구체적으로 살펴 보면 컨볼루셔널 신경망(Convolutional Neural Network, CNN)이 발화의 구성을 파악하여 어떤 음색(Tone) 후에 어떤 음색이 이어지는지, 어떤 파형(Waveform)이 자연스러운지 학습하게 되며, 이를 토대로 아주 부드러운 음성을 합성하게 됨


Ø 딥마인드는 웨이브넷이 인간의 미묘한 톤이나 억양, 말할 때의 속도 등을 그대로 재현할 수 있다고 설명했는데, 음성 연결 합성 방식이나, 인간 음성 샘플 없이 기계가 음성을 생성하는 방식(Parametric TTS) 등 기존 기술과 블라인드 테스트를 한 결과 인간의 실제 음성에 육박하는 수준의 높은 점수로 1위를 차지했다고 함


Ø 단 작년 발표 시점에서 웨이브넷은 음성 합성을 빠르게 수행 할 수 없어 0.02 초의 오디오를 생성하는데 1 초가 필요했으나, 그 동안 알고리즘 개선을 통해 빠른 음성 합성까지 가능해졌다고 하며, 현재 1 초 길이 오디오를 50 밀리 초에 생성하므로 실시간 사용이 가능하다고 함


[1] 딥마인드 웨이브넷과 음성 합성 기술의 비교

 

Concatenative

Parametric

WaveNet

인간의 음성

미국식 영어

3.86

3.67

4.21

4.55

만다린 중국어

3.47

3.79

4.08

4.21

<자료> DeepMind


ž 하드웨어들의 주요 기능이 점차 천편일률적으로 되어 가는 상황에서, 이번 구글의 신제품 발표회는 향후 AI 최적화가 스마트 기기의 시장 성패를 가르게 될 것임을 강하게 시사


Ø 구글홈을 비롯해 이번에 구글이 발표한 제품들의 배후에는 최신 AI 기법이 광범위하게 사용되고 있는데, 이용자의 음성을 인식하는 데뿐만 아니라 음성 합성 역시 AI 없이는 매력적인 특색을 실현할 수 없음을 보여주고 있음


Ø 소프트에어 기업인 구글이 자체 하드웨어 생산에 나선 데에는 여러 가지 이유가 있겠으나, 하드웨어를 통한 차별화는 이제 한계에 다다르고 소프트웨어를 통한 차별화, 그 중에서도 AI에 의한 차별화가 제품 경쟁력의 핵심 요소가 될 것으로 판단했기 때문이라 볼 수 있음


Ø 가령 지금까지 스마트폰의 경쟁 구도는 애플의 소프트에어 최적화와 삼성전자의 하드웨어 고사양화로 요약할 수 있는데, 아이폰이 상대적으로 낮은 하드웨어 사양을 소프트웨어 최적화로 커버했다면, 갤럭시 폰은 소프트웨어의 단점을 하드웨어 혁신으로 커버하는 전략이었음


Ø 그러나 최근 들어 아이폰이나 갤럭시 폰을 비롯해 대부분의 스마트폰 사양들은 유사해지고 있는데, 구글은 이를 하드웨어 혁신의 속도가 둔화된 것, 즉 하드웨어 부문을 직접 관리하는 부담이 적어지는 신호로 받아들였을 가능성이 큼


Ø 따라서 보다 중요해지는 것은 애플과 같은 소프트웨어 최적화 역량인데, 구글은 안드로이드 OS와 하드웨어의 최적화에 덧붙여 AI 최적화를 무기로 하드웨어 비즈니스에 뛰어들려는 것으로 해석할 수 있음


Ø 하드웨어 경쟁력보다 소프트웨어 경쟁력이 압도적 이윤을 가져다 줄 수 있다는 점은 이미 애플과 삼성전자의 경쟁에서 확인된 바 있거니와, 구글은 이에 더해 AI가 제품의 차별화와 이윤을 가져다 줄 것이라 주장하는 것임


Ø 구글이 던진 AI 최적화의 화두는 스마트 디바이스 시장의 경쟁 지형을 새롭게 재편할 가능성이 크며, 디바이스 제조업체들 앞에 쉽지 않은 숙제가 던져진 셈

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1799호(2017. 6. 7 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

AI가 AI를 개발한다, 구글의 전사 인공지능 프로젝트 Google ai.pdf



[ 요 약 ]


작년 11인공지능 퍼스트(AI First) 기업을 선언했던 구글의 선다 피차이 CEO는 올해 구글 I/O 컨퍼런스에서 그간의 성과를 설명하며 인공지능을 구글의 모든 제품과 서비스의 기반으로 삼는다는 전략 하에 Googl.ai 프로젝트를 진행 중이라고 설명. Google.ai의 연구 테마에는 사람이 아닌 인공지능이 인공지능의 알고리즘을 설계하는 AutoML이 포함되어 있으며, 이 연구 성과를 바탕으로 구글의 제품을 개선하고 인공지능 연산 처리를 위한 새로운 데이터센터를 구축한다는 계획


[ 본 문 ]

ž구글은 최근 개최된 연례 개발자 컨퍼런스 ‘Google I/O 2017’에서, 전사 차원의 인공지능(AI) 전략으로 ‘Google.ai’ 프로젝트를 진행 중이라고 공개


Ø 작년 11월 제품 발표회에서 인공지능 최우선(AI First) 기업을 선언한 바 있는 선다 피차이 CEO는 올해 I/O 컨퍼런스 기조연설에서 전사 차원의 AI 전략을 실행 중에 있다고 밝히며 프로젝트의 세부사항에 대해 발표하였음  구글은 최근 개최된 연례 개발자 컨퍼런스 Google I/O 2017에서, 전사 차원의 인공지능(AI) 전략으로 Google.ai 프로젝트를 진행 중이라고 공개

<자료> Engadget


[그림 1] Goolge.ai를 발표하는 선다 피차이 CEO


Ø 현재 진행 중인 전사 프로젝트의 명칭은 Google.ai로 고도의 AI를 개발하고 이를 구글의 모든 제품과 서비스의 기반 기술로 삼는다는 전략을 구현한 것임


Ø 진행 중인 Google.ai 프로젝트는 「기초연구」, 「도구」, 「응용기술」의 세 분야로 구성되어 있는데, 기초 연구는 고도의 AI 기술의 개발을, 도구는 AI를 실행하는 프로세서 등에 기반한 AI 데이터 센터의 제공을, 응용기술은 AI를 통한 구글 서비스의 개선을 목표로 하고 있음


ž 「기초연구」 분야에서 구글이 주목하고 있는 연구 테마는 AutoML인데, 이는 AI AI를 생성하는 기술의 개발을 통해 알고리즘 개발 임무를 인간에서 AI로 이관하려는 것임


Ø AutoML은 기계학습(Machine Learning)을 자동 생성하는 연구, 다시 말해 알고리즘이 다른 알고리즘을 생성하는 기법을 개발하는 것으로 [그림 2]AI AI를 생성하는 것을 보여주는데, 왼쪽이 인간이 만든 AI 알고리즘이며 오른쪽은 그 AI가 만들어 낸 딥러닝 알고리즘임


Ø [그림 2]의 사례는 처리 결과를 다음 단계로 루프시키는 반복(Recurrent) 구조의 네트워크로 시간에 의존하는 언어처리 등에 따라 언어 처리 등에 사용될 수 있는데, 이 알고리즘에 한 단어를 입력하면 다음 단어를 예측해 줌


<자료> Google Research Blog


[그림 2] 사람과 인공지능이 설계한 기계학습 알고리즘 아키텍처 비교


Ø AI가 생성한 알고리즘 아키텍처를 보면 사람이 설계한 것과 동일한 특징을 공유하기도 하지만, 증식적인 조합을 구현하기 위해 새로운 엘리먼트를 구사하는 것처럼 주목할 만한 차이를 보이는데 이런 방식은 사람이라면 반복 구조의 네트워크에서 대개는 사용하지 않는 것임


Ø 보통 알고리즘의 개발 연구자의 경험과 감이 크게 작용하며, 기존에 확립된 기술을 기반으로 개선점을 찾아 새로운 모델을 생성하게 됨


Ø 반면 AI는 수 많은 알고리즘을 생성하고 이들의 실제 학습 수행 정도를 파악하는 방법, 즉 피드백을 바탕으로 정확한 알고리즘을 만드는 방법을 학습함


Ø 인간은 소위 정석이라 불리는 것들을 축적하지만, AI는 때로 사람이 생각하기에 상식을 뒤집는 방식을 생성하는데, 선다 피차이 CEO의 설명에 따르면 인간이 생성한 알고리즘보다 AI 생성한 알고리즘의 정밀도가 더 높다고 함


Ø AutoML는 구글의 딥러닝 AI 리서치 센터인 구글 브레인(Google Brain)에서 연구 중이며 AI가 최적의 네트워크 구성을 자동으로 설계하는 것을 목표로 하는데, 이는 딥러닝 알고리즘 설계의 임무를 연구원에서 AI로 이관시킴을 의미함


Ø 이는 어찌 보면 AI 연구자 자신도 AI의 진화로 인해 일자리를 잃게 됨을 의미하나, 현재는 AI 연구자의 수가 절대적으로 부족하기 때문에 AutoML은 인력 부족을 해소하는 수단이 되며, 구글은 AI로 대체 가능한 연구인력을 AI 클라우드 개발로 돌려 관련 사업을 강화한다는 계획임


ž 「도구」 분야와 관련해서는 대규모 연산을 위한 확장성에 초점을 맞춘 인공지능용 프로세서로 Cloud TPU를 발표하였음


Ø TPU(Tensor Processing Unit)는 기계학습 연산 전용 프로세서인데, 텐서(Tensor) Trillion Sensor의 합성어로 향후 전세계가 수조 개의 센서들을 연결될 것이란 뜻을 담고 있음


Ø Cloud TPU 2세대 TPU로서 대규모 연산을 위한 확장성을 중시한 설계로 되어 있으며, 성능은 180Tflops(테라플롭스)64GB의 고속 메모리를 탑재한다고 함


Ø 플롭스(FLOPS, FLoating point OPerations per Second)는 컴퓨터의 성능을 수치로 나타내는 단위로 1초 동안 수행할 수 있는 부동소수점 연산의 횟수를 의미하며, 테라플롭스는 1초에 1조 번(1012) 연산 처리가 가능하다는 뜻


Ø 64개의 Cloud TPU가 보드에 탑재되면 TPU 파드(Pods)를 구성하게 되는데, 파드의 최대 성능은 11.5 Pflops(페타플롭스, 테라플롭스의 1천 배)로 이는 수퍼 컴퓨터 수준의 성능임



<자료> Engadget


[그림 3] 인공지능용 프로세서 Cloud TPU() AI 퍼스트 데이터센터(아래)


Ø TPU 파드는 랙에 탑재되어 구글 연산 엔진(Google Compute Engine)으로 제공될 것이며, 구글은 Cloud TPU를 이용한 AI 처리 전용 데이터 센터를 구축할 계획인데, 이를 AI 최우선 데이터센터(AI First Datacenter)라 부르고 있음


Ø Cloud TPU 발표와 동시에 구글은 텐서플로우 리서치 클라우드(TensorFlow Research Cloud)를 발표했는데, 이는 Cloud TPU 1천 개 연결한 연구자들을 위한 클라우드 서비스로 고도의 AI 기술 개발을 위해 무상으로 제공한다고 함


ž 「응용기술」 분야와 관련해서는 인공지능을 카메라에 응용한 신제품 구글 렌즈(Google Lens)를 적용 사례로 소개하였음


Ø 구글 렌즈는 카메라의 렌즈를 AI로 구성한다는 아이디어로, 카메라의 기능과 성능을 AI 소프트웨어가 결정한다는 뜻이며, 사진 촬영을 시작하면 카메라가 AI를 이용해 이미지를 재구성함


<자료> Google.ai


[그림 4] 카메라에 AI를 결합한 구글 렌즈


Ø 가령 [그림 4]처럼 야간 촬영 시 이미지에 노이즈가 있을 경우 AI가 이를 보정하는데, 셔터를 누르면 카메라가 자동으로 여러 차례(16, 32회 등) 빛에 노출시킨 후 노이즈를 제거하는 것을 반복하게 됨


Ø 또한 철조망 뒤에서 사진을 찍을 경우 AI가 자동으로 철조망을 제거하는 이미지 인페인팅(Image Inpainting) 기능도 갖추고 있음


Ø 구글 렌즈는 카메라에 비친 객체를 판정하는 기능이 있어, 가령 꽃 촬영에 구글 렌즈 기능을 선택하면 꽃의 종류가 무엇인지를 식별하고, 길거리 상점을 촬영하면 그 간판의 이름을 인식한 후 관련된 정보를 함께 표시해 줌


Ø 즉 카메라가 이미지 검색의 입력 장치가 되는 것으로 이는 구글 고글(Google Goggles) 등에서 이미 제공되는 기능이지만, AI를 이용하여 그 기능성과 인식 정확도를 향상시켰음


ž 드러나 보이지 않는 곳에서 AI를 이용해 구글의 서비스를 폭넓게 지원하는 응용 사례로는 구글 지도와 지메일을 소개하였음


Ø 카메라의 이미지 인식 기능을 AI와 접목하는 기술은 구글 스트리트 뷰(Street View)와 구글 지도(Google Maps)에도 적용되어 활용되고 있음


Ø 스트리트 뷰는 촬영된 이미지에서 건물에 부착되어 있는 숫자를 읽어 식별할 수 있었는데, 지금은 AI가 숫자뿐만 아니라 거리의 이름도 읽어 정확히 위치를 파악할 수 있음


Ø 표지판이 선명하게 찍혀 있지 않은 경우라도 샘플이 네 장 AI가 정확하게 판정할 수 있다고 하는데, 구글은 이 기술을 스트리트 뷰로 촬영한 800억 장의 이미지에 적용하여 위치를 파악하고 있기 때문에 구글 지도의 정확도를 크게 향상시켰다고 함


Ø 이미지 인식 기능의 활용은 와이파이 접속에도 이용할 수 있는데, 스마트폰으로 와이파이 네트워크 이름과 패스워드를 스캔하면 자동으로 와이파이에 연결하도록 도와줄 수 있음


Ø 스마트 회신(Smart Reply) 기능이 탑재된 지메일 역시 AI의 지원으로 구글 서비스 편의성을 강화한 대표적 사례인데, AI는 수신한 메일의 제목과 내용을 파악하여 이용자를 대신해 최적의 회신 문장을 생성한 다음 이용자에게 제시함


Ø 이용자는 AI가 제시한 세 개의 회신 문장 중에서 가장 낫다고 생각하는 하나를 클릭하는 것만으로 메일 회신을 할 수 있는데, 스마트 회신 기능이 등장한 지는 1년이 넘었으며 지금은 다소 복잡한 내용의 메일에도 회신 문장을 생성할 수 있는 수준이 되었음




<자료> Engadget


[그림 5] 인공지능 활용한 이미지 인식 기능 개선()과 이메일 자동 회신(아래)


Ø 이처럼 인공지능은 겉으로 드러나게 또는 드러나지 않게 기능성 향상에 기여하고 있으며, 구글은 이번 개발자 컨퍼런스에서 향후 자신들의 모든 제품과 서비스에 AI를 적용해 개선시키겠다는 목표를 밝힌 것임


ž 「응용기술」 분야와 관련해서 또 하나 주목할 것은 구글이 AI를 의료 분야에 적용할 계획임을 명시했다는 것으로, 향후 IBM 및 애플과 치열한 기술 경쟁을 예고하고 있음


Ø 구글은 이미 AI를 사용하여 당뇨 망막증(Diabetic Retinopathy) 판정 시스템을 발표한 바 있는데, 이 병은 당뇨 합병 질환으로 실명 위기까지 이어질 가능성이 높은 것으로 알려져 있어, 정확한 판정 시스템의 개발은 질병의 조기 발견과 치료에 상당한 기여를 할 것으로 기대되고 있음


Ø 구글에 따르면 AI는 이미 의사보다 높은 정확도로 당뇨 망막증 진환을 감지해 내는 데 성공했으며, AI를 의료 이미징에 활용할 수 있다는 것이 증명되자 구글은 자회사 딥마인드(DeepMind) 함께 의료 분야에서 AI 연구 개발을 중점적으로 추진하고 있음


<자료> Google


[그림 6] AI를 이용한 의료 이미지 판독


Ø 구글이 개발한 이미지 인식 알고리즘인 구글 인셉션(Google Inception)은 세계 최고 수준의 성능으로 평가받고 있는데, 구글은 누구나 자유롭게 이 소프트웨어를 이용하여 진단 및 치료 솔루션을 개발할 수 있도록 공개하고 있음


Ø 가령 구글 인셉션 소프트웨어를 피부암의 판정에 응용하면 전문의보다 정확하게 질병을 판정 할 수 있는 것으로. 나타났는데, 특별한 알고리즘이 필요하지 않아 암 탐지 시스템의 개발 문턱이 극적으로 낮아졌기 때문에 이미 피부암 판정 스마트폰 앱까지 등장하고 있는 상황


Ø IBM 왓슨의 선도적 비즈니스가 성과를 거두며 의료 분야에서 AI 활용에 대한 평가와 전망은 매우 긍정적인데, 구글과 기술 경쟁, AI 기반 의료 기술의 공개화 등 흐름과 맞물린다면, 의료 분야에서 AI 기반의 혁신 사례는 잇따라 등장할 것으로 예상됨


ž 구글은 자신들의 모든 영역에 AI를 적용하고자 하는 AI 최우선 기업으로서 그 성과를 어필했지만 이제 시작일 뿐이며, 시장 지향 AI를 향한 본격적 행보 선언에 그 의의가 있음


Ø 구글은 인공지능 퍼스트를 모토로 내세운 기업으로 그간의 연구개발 성과와 응용사례를 소개했지만, 이번 연례 개발자 컨퍼런스에서 새로운 비전을 제시하는 놀라운 기술과 제품은 등장하지 않았다는 평가가 지배적


Ø 구글 렌즈 등의 기능도 이미 일부 활용되고 있는 기술이고, AI를 음성 인식에 응용해 고급 자연언어처리 접목한 인공지능 스피커 '구글 홈이나 가상 비서 구글 어시스턴트도 이미 소개된 기술일뿐더러 이 분야에서는 오히려 아마존 에코와 알렉사가 시장을 선점하고 있는 상황임


Ø 이는 세계 최고 수준의 AI 기술을 보유하고 있는 구글이지만, 의료와 같은 특수 분야를 차치하고 나면 일상적으로 소비자들이 AI의 혜택을 느낄 수 있는 제품과 서비스를 개발한다는 것은 쉽지 않은 일이라는 것을 보여주는 대목


Ø 기술 특이점(singularity) 접근 전망과 함께 하루가 다르게 고도화되어 가고 있는 AI를 어떻게 제품과 서비스에 연결시킬 것인가에 대한 질문도 계속해서 나오고 있으며, 이에 대한 대답을 내놓는 것은 구글뿐 아니라 IT 업계가 공통으로 안고 있는 과제일 것임


Ø 그러나 어쩌면 소비자의 욕구와 잠재 욕망을 자극할 수 있는 AI 기반 제품과 서비스의 개발 역시 사람이 아닌 인공지능 스스로가 만들어 낼 지도 모를 일이며, 그런 면에서 AI AI를 만든다는 모토를 제시하고 있는 구글이 접근방식에서는 유리한 상황이라 할 수 있겠음


※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1798호(2017. 5. 31 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

인공지능 음성비서 서비스 탑재 기기 2021년 75억 대 이상 전망.pdf



ž 통신산업 시장조사기관 오범(Ovum)에 따르면 2021년 인공지능(AI) 음성인식 가상 비서 서비스를 이용할 수 있는 기기의 대수는 75억 대를 넘어설 전망


Ø 오범에 따르면 음성 인식 가상 비서 서비스는 현재 주로 스마트폰과 태블릿에서 이용되고 있는데, 2016년 말 현재 서비스 이용이 가능한 하드웨어 대수는 35억 대로 추산되며, 구글의 구글 나우(Google Now)와 애플의 시리(Siri)가 대부분을 차지하고 있음


Ø 그러나 2021년에는 현재 세계 인구를 넘어서는 75억 대에 이를 것으로 예상되며, 구글 어시스턴트(Google Assistant)가 점유율 23.3%로 선두를 차지할 것으로 예측됨


Ø 그 다음으로는 삼성전자의 빅스비(Bixby)14.5%, 시리가 13.1%, 아마존의 알렉사(Alexa)3.9%, 마이크로소프트의 코타나(Cortana)2.3% 점유율을 차지할 것으로 예측


Ø 기기 유형도 다양해져 향후에는 스마트폰과 태블릿 등 모바일 기기 외에도 스마트홈을 중심으로 새로운 기회가 열릴 것으로 예상되는데, 가상 비서와 음성 AI를 지원하는 스마트 홈 제품, TV, 웨어러블 기기의 수는 2021 년에 16 3천만 대에 달할 것으로 추정됨


<자료> Ovum


[그림 1] 2015-2021가상 비서와 음성 AI 지원 디바이스 추이 전망


Ø 특히 현재 인공지능 스피커 제품에 쏟아지고 있는 거대한 관심에도 불구하고, 비 모바일 기기 중에는 TV 기기(스마트 TV, 셋톱박스, 미디어 스트리머 등 포함) 57%로 가장 높은 점유율을 차지할 것으로 전망


ž 지역적 관점에서 보면, 음성 인식 가상 비서 서비스 이용은 북미 중심에서 벗어나 전 지구적 서비스로 확산될 것으로 예상됨


Ø 2016년 말 현재 아마존 알렉사와 구글의 구글 어시스턴트의 경우 북미 지역의 이용자 점유율이 95%에 이를 정도로 지역적 편중이 심한 상태이나, 2021 년에는 서비스가 전세계로 확산되고 아시아와 오세아니아 지역이 47.6%의 점유율을 차지할 것으로 전망됨


Ø 아시아 지역에서는 당연히 중국 시장의 성장이 두드러질 것인데, 2016년 기준 중국어를 지원하는 음성 비서 서비스 제공 하드웨어 기기 대수는 4,300만 대 수준이며, 바이두(Baidu)와 아이플라이테크(iFlytek) 등의 업체가 선도하고 있음


Ø 그러나 2021년에 중국어를 지원하는 음성 비서 서비스 제공 하드웨어 수는 12억 대에 달할 것으로 예상되며, 이는 애플의 시리와 삼성전자의 빅스비와 비슷한 규모가 될 것으로 보임

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1782호(2017. 2. 8 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

AI 음성 클라우드 석권 조짐.pdf



[ 요 약 ]


아마존의 인공지능(AI) 스피커 에코(Echo)가 자연스러운 대화 기능으로 호평 받으며 폭발적인 판매 증가세를 보이고 있음. 아마존은 이러한 대화 기능을 AI 음성 클라우드 서비스 형태로 공개했고, 기업체들은 잇따라 아마존의 음성 AI 서비스인 알렉사(Alexa) 도입 계획을 발표하고 있음. 가전은 물론 로봇, 자동차 업체들의 러브 콜을 받고 있는 아마존은 서버 클라우드 사업의 뒤를 이을 새로운 시장으로 AI 기반 음성 클라우드 비즈니스 모델을 구축하고 이 시장을 석권하려 할 것으로 보임



[ 본 문 ] 


◈ 아마존 개발 팀은 인간의 본질적인 커뮤니케이션 수단이 이라는 점에 주목해, 대화를 이용한 주변 기기를 제어할 수 있는 인공지능을 개발하였음


아마존은 2014년 인공지능(AI) 스피커를 표방하며 선보인 에코(Echo)' 제품은 현재까지 누적 510만 대가 출시되며 히트상품 반열에 들어서고 있고, 지금은 에코 탭(Echo Tap, 휴대용 에코)에코 닷(Echo Dot, 소형 버전의 에코)이 제품 라인에 추가된 상태


<자료> Android Central


[그림 1] 아마존 에코 라인업


• 인공지능 스피커 제품의 이면에서는 AI 음성 기능인 알렉사(Alexa)가 구동되어 이용자와 대화가 가능하도록 주관하는데, 기기에 말을 걸면 음악을 재생하고 뉴스를 들려 주며, 스마트 홈의 허브로 기능할 수 있기 때문에 다른 가전도 말로 조작 할 수 있게 해 줌


아마존은 2012년에 알렉사의 개발을 시작하며 클라우드 기능을 모두 음성으로 조작하는 시스템을 목표로 했는데, 이 아이디어는 TV 프로그램 스타트렉(Star Trek) 중 우주선 내의 복잡한 기기들을 말로 조작하는 장면에서 힌트를 얻었다고 함


알렉사는 기기에 손대는 일 없이 음성 만으로도 정보에 접근하고 가전 제품을 조작 할 수 있는 환경을 제공하는데, 말은 인간의 본질적인 커뮤니케이션 수단이며 이러한 특징을 아마존 개발팀은 알렉사 개발에 적용한 것


◈ 아마존의 알렉사는 자사의 제품으로만 적용이 제한되어 있지 않으며, 플랫폼으로서 자리매김하여 그 위에 생태계가 형성되는 것을 지향하고 있음


<자료> Amazon


[그림 2] 아마존의 알렉사 플랫폼 전략


• 알렉사는 이미 외부에 공개되어 있고 많은 기업에 적용되어 음성 서비스를 제공하고 있으며, 써드파티 협력업체들은 이 기능을 이용해 음성으로 조작이 가능한 보이스 앱(voice app)의 개발에 나섬으로써 생태계에 동참하고 있음


아마존과 협력사들이 개발하고 있는 보이스 앱은 스킬(Skill)이라 부르는데 에코 출시 초기에는 10개 정도에 불과했던 스킬이 지금은 5,000개를 넘어섰다고 함


최근 인기 있는 스킬은 어메이징 워드 마스터 게임(Amazing Word Master Game)으로 에코와 끝말 잇기를 하는 게임 앱인데, 영어 공부에 도움을 받을 수 있는 것도 장점이지만 혼자서 할 일이 없을 때 에코를 놀이 상대로 삼을 수 있음을 잘 보여주는 사례임


비즈니스와 연계 된 스킬이 많아지고 있는 것도 특징인데, 가령 여행 사이트 익스피디아(Expedia)는 작년 말부터 알렉사를 이용한 음성 서비스를 제공하고 있으며, 비행기를 예약한 사람은 에코와 대화 방식으로 비행 세부내역을 확인할 수 있음


아마존 알렉사 플랫폼에서 주목해야 할 것은 에코에서만 작동하는 스킬 생태계 구축에 목표를 한정하는 것이 아니라, 음성 조작 기기를 개발하고 있는 업체라면 누구나 알렉사를 이용해 자신들의 제품에 음성 기능을 통합할 수 있게 하려는 개방형 정책을 편다는 점


◈ 알렉사 플랫폼이 우선 적용될 것으로 예상되는 분야는 에코와 동일한 카테고리인 가전과 가전 서비스인데, 위성 TV 서비스 디쉬(Dish) LG전자가 알렉사 도입 계획을 발표하였음


디쉬는 셋톱박스인 Hopper DVR을 에코 또는 에코 닷과 연결하여 TV를 말로 조작할 수 있는 기능을 제공할 계획임



<자료> DISH


[그림 3] 디쉬 위성TV 서비스와 에코 연계


• 가령 에코에 대해 알렉사 ESPN으로 가(Alexa, Go to ESPN)라고 지시하면 ESPN으로 채널을 변경하며, 프로그램을 검색하며 알렉사 레드삭스 중계 채널이 어디지?(Alexa, what channel is the Red Sox game on?)라고 물으면 에코가 해당 채널을 찾아 대답해 줌


이 서비스는 2017년 상반기부터 제공될 예정인데, 소비자 반응에 따라 앞으로 TV는 리모컨뿐만 아니라 음성 조작이 필수 인터페이스가 될 가능성이 있음


구글 역시 AI 대화 기능인 어시스턴트(Assistant)를 통해 TV를 음성으로 조작 할 수 있는 기능을 제공하고 있는데, 향후 TV 조작 음성 인터페이스의 패권을 놓고 에서 아마존의 알렉사와 구글의 어시스턴트가 치열한 경쟁을 벌일 것으로 예상



• 한편 LG전자는 스마트 냉장고인 'Smart InstaView Door-in-Door' 모델이 알렉사 보이스 서비스를 이용할 것이라 발표하였음


이 냉장고는 29인치 터치 스크린을 탑재하고 있으며, 이미 마이크로소프트의 음성 AI코타나(Cortana)를 인터페이스로 이용해 왔으나, 이를 알렉사로 변경한다고 밝힌 것


알렉사를 통해 이용자는 음성으로 레시피를 검색하고 쇼핑 목록을 만들 수 있으며 아마존닷컴에서 쇼핑까지 할 수 있기 때문에 냉장고를 스마트 홈의 허브로서 사용할 수 있음


LG전자의 스마트 냉장고는 가전의 진화 방향을 보여주고 있다는 평가이며, 향후 음성으로 조작 할 수 없는 가전 제품은 팔리지 않게 될 수 있음을 시사하고 있음


<자료> Engadget


[동영상알렉사 탑재 LG전자의 인공지능 음성 제어 냉장고


◈ 가전 다음으로 알렉사의 적용이 용이한 분야는 스마트폰인데, 화웨이(Huawei)는 자사의 최신 스마트폰 메이트(Mate) 9에 알렉사를 미리 설치하여 출시할 것이라 밝혔음


CES 2017에서 화웨이는 메이트 9에 보이스 앱이 탑재될 예정이며, 그 기저에는 알렉사 보이스 서비스가 사용될 것이라 발표하였음


이용자는 음성으로 메모를 작성하고, 날씨나 교통 체증 정보를 알려달라고 할 수 있으며 또한 메이트 9을 스마트홈의 허브로 삼아 가전 제품을 조작 할 수도 있다고 하는데, 이러한 보이스 앱은 올해 상반기부터 제공될 예정이라고 함


구글은 이미 안드로이드용 AI 대화 기능인 어시스턴트(Assistant)를 제공하고 있으며 이를 이용한 메신저도 선보이고 있기에, 올해 안드로이드 스마트폰 시장에서는 어시스턴트와 알렉사와 정면 대결이 볼만할 것으로 예상되고 있음


◈ 스마트폰 앱 개발업체들도 알렉사 스킬을 새로운 앱스토어 생태계로 보고 점차 관심을 기울이고 있는데, 스타벅스는 최근 알렉사를 활용한 앱 기능을 선보여 관심을 모으고 있음


<자료> YouTube


[동영상] 음성 AI를 도입한 스타벅스


• 평소 우리는IT 기업이다라고 외쳐온 스타벅스는 최근 AI를 활용한 음성 작동 챗봇을 개발해 사용하는 한편, 아마존 알렉사를 이용해 집 안에서 인근 스타벅스에 미리 주문을 넣을 수 있는 기능을 선보였음


이용자가 에코 스피커에 알렉사, 내 스타벅스를 주문해줘라고 말하면 인근 스타벅스 매장에 이용자가 평소 먹는 커피의 주문이 전달되는데, 이 기능을 사용하려면 스타벅스 모바일 주문·결제 계정을 만들어야 함


스타벅스의 새로운 기능들은 매장에서 모바일 앱으로 주문하려면 긴 줄을 서야 한다는 불만이 터져 나온 이후 개발됐다고 하는데, 모바일 앱을 통한 스타벅스 판매는 전체의 27%에 해당하기 때문에 스타벅스는 해결책을 제시해야 했고, 그 해답을 음성에서 찾은 것


◈ 커넥티드 카와 연계는 알렉사 플랫폼의 적용 분야가 광범위하게 확산될 가능성을 보여줄 수 있는데, 포드는 자동차 메이커로는 처음으로 알렉사 보이스 서비스의 도입을 결정하였음


이용자는 집 안에 있는 에코를 통해 포드 자동차를 조작 할 수 있는데, 알렉사, 마이포드 모바일에 시동을 걸라고 요청해줘(Alexa, ask MyFord Mobile to start my car)라고 에코에 지시하면 엔진 시동이 걸리게 됨


운전 중에는 센터페이사의 디스플레이 패널에서 알렉사를 이용할 수 있는데, 목적지 검색과 차고 문 개폐 등을 말로 지시 할 수 있음


이는 포드의 싱크(SYNC) 3 기술과 연계한 것으로 운전자의 스마트폰 앱에서 자동차로 접근하는 것과 같은 구성이며, 원격 시동 기능은 CES 2017에서 이미 선보였고 차량 내 알렉사 이용은 올 여름부터 가능할 것이라고 함


<자료> Ford Media

[동영상] 포드 싱크3와 연계되는 아마존 에코의 알렉사


• 자동차가 자율운전 차량으로 진화해 가고 있기 때문에, 운전자와 자동차의 인터페이스가 음성이 되는 것은 어찌 보면 당연한 흐름이기에 알렉사와 같은 음성 AI와 커넥티드 카의 결합 흐름은 앞으로 더욱 확대될 전망


◈ 자동차와 더불어 로봇 역시 음성 AI 플랫폼의 적용 분야로 높은 관심을 받고 있는데, 중국 선전에 본사를 둔 유비테크(UBTech)는 알렉사를 내장한 로봇 링크스(Lynx)를 발표하였음


링크스는 알렉사 보이스 서비스를 내장하고 있어 말로 조작이 가능한 로봇으로 음악 재생이나 메일 읽기 등을 음성으로 지시할 수 있음


이 로봇은 알렉사가 제공하는 기능 외에도 탑재하고 있는 카메라로 이용자를 식별해 개인별로 맞춤형 대응이 가능한 것이 특징이라고 하며, 또한 카메라를 보안 모니터로 사용하면 링크스를 이용해 외출 시에도 주택을 감시할 수 있다고 함


<자료> UBTech


[동영상] 알렉사 탑재 휴머노이드 로봇 링크스


• 그 동안 로봇 개발에서는 대화 기능이 걸림돌이 되어 왔지만, 알렉사 보이스 서비스를 이용할 수 있게 되면서 개발 기간을 단축할 수 있게 되었고, 손쉽게 로봇을 개발할 수 있게 됨에 따라 로봇시장의 진입 장벽이 크게 낮아질 것이란 전망도 나오고 있음


링크스의 가격은 800 달러에서 1,000 달러로 2017년 후반에 정식 출시될 예정인데, 링크스의 성공 여하에 따라 알렉사가 로봇의 표준 인터페이스로 자리 잡을 가능성도 있음


◈ 이처럼 다양한 분야의 제조업체들이 잇따라 알렉사 플랫폼에 호응하는 이유에 대해 전문가들은 AI를 활용한 고급 대화 기능을 경쟁사 보다 월등히 구현해주기 때문이라 평가하고 있음


알렉사를 탑재한 기기들은 알렉사라는 호명을 감지하면 이후 이어지는 음성 스트림을 클라우드로 전송하며, 일련의 대화 처리는 클라우드에서 이루어짐


구체적으로는 음성 인식, 자연어 처리, 문자-음성 합성(Text-to-Speech Synthesis)의 처리가 실행되며, 이 과정에서 AI가 사용되는데 아마존은 하나의 AI가 아니라 각 모듈 별로 고급 AI가 구현되어 음성 서비스를 지원한다고 함


알렉사가 고급 대화 기능을 제공 할 수 있는 이유로는 AI 알고리즘을 최적화하는 교육 데이터의 강점이 꼽히는데, 여기서 교육 데이터는 말(사운드)과 그것을 표시하는 문자(텍스트)의 조합을 의미함


AI 알고리즘 개발에 사용하는 음성 교육 데이터로는 주로 콜 센터 오퍼레이터들의 대화가 사용되나, 가정에서 주로 사용하는 대화(가령 차고 문 닫아 )를 기반으로 한 교육 데이터는 거의 없다고 함


아마존은 2014 11월에 에코 출시 이후 이용자의 피드백 등을 사용하여 교육 데이터를 정비해 왔으며, 이런 데이터 축적이 고급 대화 기능 구현에 있어 타의 추종을 불허하는 이유가 되고 있다는 분석


◈ 전문가들은 아마존이 이러한 알렉사의 경쟁력을 바탕으로 아마존 웹서비스(AWS)의 성공을 뒤이을 새로운 비즈니스로 AI 음성 클라우드 서비스 시장을 개척해 나갈 것이라 예상


AWS가 여러 난관을 뚫고 성장하며 지금은 대기업들도 사용하는 서비스로 성장한 것처럼 아마존은 AI 음성 클라우드 서비스의 가능성에 확신을 가지고 있는 것으로 보임


우선은 AI 음성 클라우드 서비스가 이슈화되는 것이 중요하기 때문에, 아마존은 구글 어시스턴트 같은 경쟁 서비스의 존재를 반기는 입장이며 적대적 경쟁관계로 보지 않고 있음


이는 홈킷(HomeKit)을 통해 폐쇄적인 생태계를 구축하려 하는 애플의 정책과 대별되는 아마존의 플랫폼 정책이라 할 수 있음


아마존은 이미 스마트홈, 가전, 자동차, 로봇 등 여러 분야에서 AI 음성 서비스 시장을 선도하고 있기 때문에, 일단 시장이 형성되고 나면 석권할 수 있다는 기대와 자신감이 있는 것으로 보이며, 전문가들도 실제 아마존의 기술이 표준이 될 가능성도 내다보고 있음


◈ 아마존이 AI 음성 클라우드 시장의 초기 주도권을 선점함에 따라, 가전, 자동차, 로봇 제조업체들은 알렉사를 이용할 것인지, 자체 개발할 것인지 선택의 기로에 서게 될 전망


다양한 기기 제조업체들은 알렉사 보이스 서비스를 통해, AI 음성 기능을 독자적으로 개발하는 수고를 줄이면서도 자신들의 제품에 대화 기능을 통합할 수 있게 되었음.


자체 기술 개발에 대한 미련과 유혹은 항상 존재하지만, 알렉사를 기본 기능으로 채택하고자 결정하는 기업들이 늘어난다면, AWS가 그랬던 것처럼 알렉사 보이스 서비스가 표준 AI 음성 클라우드 서비스로 자리매김할 가능성이 있음


<자료> Lenovo


[그림4] 알렉사 탑재 레노보의 AI 스피커


• 기업들은 알렉사는 기본기능으로 두고 다른 요인에서 차별성을 찾는 전략을 구사할 수 있는데, 레노보의 AI 스피커 스마트 어시스턴트(Smart Assistant)는 이런 흐름을 잘 보여줌


스마트 어시스턴트는 에코와 모양뿐 아니라 기능적으로도 매우 유사한 제품이나, 차별점은 프리미엄 스피커인 하만 카돈(Harman Kardon)을 탑재하고 있다는 것


올해 5월부터 판매될 스마트 어시스턴트는 에코와 동일 기능, 더 나은 스피커임에도 가격은 에코와 동일한 180 달러로 책정하여 경쟁력을 확보할 방침인 것으로 알려짐


레노보와 같은 전략을 취할 것인지, 독자 AI 음성 기술을 개발을 것인지 기업들은 선택해야 하는데, 이는 마치 클라우드 서비스를 이용할 것인지 아니면 기업 내부에 자체 컴퓨팅 환경을 구축할 것인지 선택하는 문제와 유사함


확실한 것은 알렉사로 인해 점점 더 많은 기업들이 자신들의 제품과 서비스에 AI 음성 기능의 접목을 고려하지 않을 수 없게 되었다는 것이며, 고민하는 기업이 늘어날수록 AI 음성 클라우드 서비스 시장도 급속도로 발전하게 될 전망

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1773호(2016. 11. 23 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

기업의 디지털 마케팅 툴로 부상하는 채팅봇.pdf



[ 요 약 ]


2000년대 초반 이후 인공지능 채팅 로봇 개발 시도는 간헐적으로 전개되어 왔으나 눈에 띄는 흐름을 만들어 내지 못하다가, 올해 4월 페이스북 메신저의 채팅봇 지원 발표 이후 관련 논의가 급물살을 타고 있음. 채팅봇은 새로운 전자상거래 플랫폼이 될 것이라는 전망이 나올 만큼 무궁한 잠재력을 지니고 있으므로, 기업의 마케팅 담당자는 채팅봇 기술을 제대로 활용하기 위해 기술에 대해 정확히 이해하고 기업 IT 부서와 긴밀하게 공동 대응해 나갈 필요가 있음



[ 본 문 ]


2016년 초반까지만 해도 채팅봇은 IT 업계에서 거의 주목받지 못했으나, 4월에 개최된 페이스북 개발자 컨퍼런스 이후 관련 논의가 급물살을 타고 있음


메신저 상에서 사람들과 대화를 나눌 수 있는 인공지능 개발은 오래 전부터 시작되었으며, 2002년 마이크로소프트(MS) MSN 메신저 상에 네트워크 에이전트를 선보인 것이 다수의 소비자를 대상으로 한 첫번째 채팅봇 구현 시도였음


그러나 MSN의 높은 인기에도 불구 에이전트 서비스는 유의미한 반향을 불러 일으키는 데 실패하였으며, 이후 채팅봇은 성인사이트 등에서 일부 고객지원 기능의 대체제로 활용되기는 했으나, 대중적인 서비스로 자리잡지는 못했음


올해 초반까지만 하더라도 상황은 비슷했으나, 최근 급속한 기술발전 양상을 보인 인공지능이 이슈로 급부상하기 시작했고, 4월에 열린 페이스북 개발자 컨퍼런스 F8에서 메신저 플랫폼과 채팅봇에 대한 발표가 이루어지면서 상황이 변하기 시작


F8 이후 MS, 구글, 아마존 등도 인공지능 기반의 대화형 서비스를 발표했고, 메신저 상의 채팅봇은 차세대 전자상거래 플랫폼으로 거론되며, 채팅봇은 일순 IT 업계의 다음 물결(next wave)로 자리매김 되고 있음


Kik(), LINE(라인), Telegram(텔리그램) 등 메시징 플랫폼에서도 자신들이 개발한 채팅봇의 실험을 진행하고 있으며, 지난 9월 말 텍사스 오스틴에서는 채팅봇 관련 컨퍼런스인 'Talkabot(토커봇)'이 개최되기도 하였음


◈ 메신저 플랫폼에서 채팅봇이 차세대 상거래를 주도할 것이라는 전망이 나오는 만큼 기업의 마케팅 담당자들은 채팅 로봇의 현재와 미래에 대해 정확히 이해할 필요가 있음


구글 어시스턴트나 아마존 에코에서 확인이 되듯, 인공지능이 사용자와 대화하며 요구사항을 수행하는 기술은 이미 궤도에 들어서고 있음


• 채팅 로봇이 차세대 전자상거래 플랫폼이 된다는 의미는 사용자의 취향을 학습한 가상 비서와 각 기업의 상품과 서비스를 판매할 수 있는 인공지능 채팅봇들간의 상호작용을 통해 상거래가 이루어지는 시대가 도래한다는 것


<자료> IITP.


[그림 1] 메신저 플랫폼과 채팅봇


기업 입장에서는 소비자의 요구사항을 잘 이해하고, 올바르게 대응하여 기업의 상품과 서비스를 판매할 수 있는 인공지능 채팅봇의 운영이 중요해지며, 디지털 마케팅과 영업의 최전선에 채팅봇이 자리잡게 됨을 의미


검색엔진, 유튜브, SNS 등 기술 트렌드에 따라 기업의 디지털 마케팅 도구도 변화하고 있는데, 다음 번 디지털 마케팅의 핵심 트렌드는 채팅봇이 될 것이란 전망인 것임


따라서 기업의 마케팅 담당자는 채팅봇 기술의 현재와 미래, 실제로 마케팅 효과가 있을 지에 대한 판단, 채팅봇을 운영하기 위해 필요한 자원과 전사적 협력 체계, 운영 시 유의사항은 무엇인지에 대해 정확히 이해할 필요가 있음


◈ 기업의 마케팅 담당자들이 채팅봇에 대해 알아야 할 항목은 크게 7가지인데, 우선 채팅봇이 무엇인지 정확히 이해해는 것으로부터 출발해야 함


채팅봇 전문 사이트 챗봇 매거진(ChatbotsMagazine.co)은 채팅봇에 대해, 인간이 채팅 인터페이스를 통해 접촉하는 서비스로 규칙에 따라 작동되며, 때로 인공지능(AI)이 사용되는 경우도 있음이라 정의하고 있음


챗봇 매거진에 따르면 현존하는 채팅봇은 크게 두 가지로 나누어 볼 수 있는데, 첫번째는 기업들이 사업의 목적에 맞게 제공하는 채팅 로봇으로 일반적인 메시징 앱에서 사용할 수 있음


예를 들어 페이스북 메신저 앱에서 사용할 수 있는 CNN의 뉴스 채팅봇이나, 꽃 배달업체 1-800-Flowers의 선물용 꽃꽂이 상품 선택과 배송을 지원하는 채팅봇이 대표적


두 번째 유형은 챗봇 플랫폼으로 애플의 시리(Siri), 구글의 구글 어시스턴트(Google Assistant), 아마존의 알렉사(Alexa), MS의 코타나(Cortana) 같은 가상 비서가 해당함


채팅 로봇 플랫폼은 특정 기업과 소비자의 접촉을 지원한다기 보다 다종다양한 정보 및 다른 수요와 관련해 이용자들을 지원하는 기능을 함


◈ 마케팅 담당자들이 알아야 할 두 번째 항목은 활용 범위로, 현 단계에서 채팅봇은 전자상거래, 고객 서비스, 여행, 불면증 완화 등에 이용되고 있음


• 웹사이트 봇리스트(Botlist)는 채팅봇을 플랫폼과 카테고리별로 소개하고 있는데, 메시징 앱의 채팅봇은 기본적인 커뮤니케이션 기능, 전자상거래 기능, 여행계획 수립 등을 제공함


<자료> botlist.


[그림 2] 채팅봇 검색 사이트 봇리스트


현재 채팅봇은 특히 기업들이 상거래를 촉진할 목적으로 널리 사용하고 있으며, 젊은층을 주요 타깃으로 해 이용자의 구매 욕구를 불러일으키고, 구매할 상품의 수를 늘리는데 초점을 두고 있음


채팅봇은 대고객 서비스 부서나 영업 담당자의 업무 부담 경감 효과를 가져올 수도 있지만, 더 큰 가능성을 내포하고 있는 것은 개인화(personalize)와 참여(engagement)


가령 아마존 인공지능 스피커 에코(Echo)의 경우 대화형 상거래라는 새로운 물결을 만들어 냈으며, 이용자는 자신이 필요로 하는 것을 요청하는 것 만으로 간단히 주문과 배송이 이루어질 수 있게 하였음


침대 매트리스 생산 및 판매 사업을 하는 스타트업 캐스퍼(Casper)가 불면증 환자들을 위해 제공하는 채팅봇인 인섬노봇-3000(Insomnobot-3000)도 인구에 회자되고 있는데, 이 채팅봇은 밤 11시부터 새벽 5시 사이에만 이용할 수 있음


캐스퍼의 채팅봇은 수면 혹은 수면 부족과 관련한 모든 것을 가지고 있기 때문에, 캐스퍼의 브랜드를 강화해 주며 채팅봇 이용 마케팅의 성공사례로 꼽히고 있음


캐스퍼는 이용자들을 속여 실제 인간과 대화하고 있다고 믿게 만들려는 시도를 하고 있지 않으며, 이용자들이 인기 프로그램의 재방송, 한밤중의 간식, 자주 거론되는 화제에 대해 채팅봇과 즐거운 대화를 갖도록 하는 데 초점을 두고 있음


[1] 인기를 모으고 있는 주요 채팅봇 리스트

채팅봇

주요 기능

우버

배차 의뢰

맥켈란(Macallan)/앱솔루트

신규 고객에게 적합한 위스키를 찾도록 안내해 주는 개인화 서비스

버버리

2016 9 London Fashion Week 기간 중에 자사 패션 쇼케이스

타코 벨(Taco Bell) / 도미노

음식 주문

하이 판초(Hi Poncho)

고양이 캐릭터가 일기 예보를 전달하는 메신저 앱의 인기 채팅봇

헬로보우트(HelloVote)

투표 이벤트 등록 지원

아이슬란드 에어

항공 일정 검색 및 예약

조지 타케이(George Takei)

스타트렉 TV 시리즈에서 Hikaru Sulu 역을 맡은 타케이의 개인 채팅봇.

<자료> CIO, 2016. 10, IITP 재정리


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 세 번째 항목은, 채팅봇은 갑자기 나온 기술이 아니라 수년 동안 이미 이용해 오고 있던 기술을 업그레이드한 것이라는 점


예를 들어, 항공사, 은행, 보험회사 등에 전화를 걸면 자동응답시스템이 먼저 전화를 받을 경우가 많은데 이러한 자동응답시스템 역시 로봇의 일종임


이런 유형의 시스템들은 소비자가 어떤 선택을 하도록 촉진함으로써, 이용자가 원하는 정보를 쉽게 제공하는 것을 목적으로 함


자동응답을 통한 접촉은 보통 고객경험의 향상에 연결되지는 않는 단점이 있는데, 왜냐하면 이용자가 여러 단계를 거쳐 특정 창구에 도달하더라도 결국은 보류 상태에서 기다리게 되거나 전화가 자동으로 끊어지는 일이 빈번하기 때문


이에 비해 메시징 앱과 채팅봇을 결합한 접촉은 시각적이며 반응이 빠른데, 이용자가 던진 질문에 대답이 되는 정보를 동영상이나 사진 등의 형태로 피드백 할 수 있음


이용자는 시간을 낭비하지 않아도 되고 전화가 끊길 걱정도 할 필요가 없어 채팅봇을 사용하는 편이 이용자의 참여 만족도를 훨씬 더 높여줄 잠재력이 있음


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 네 번째 항목은, 메시징 앱 전성시대는 채팅봇의 급성장도 추동할 것이므로, 채팅봇은 피할 수 없는 환경이 될 것이라는 점


모바일 앱 중에서 현재 메시징 앱이 특히 많이 사용되고 있기 때문에, 메시징 앱에서 사용할 수 있는 채팅 로봇 역시 인지도가 향상되고 있음


메시징 앱의 월간 액티브 이용자 수는 SNS 앱보다 많은데, 상위 4개 메시징 앱의 액티브 이용자 수는 월간 30억 명으로, SNS 앱의 이용자 수 5억 명에 비해 압도적


메시징 앱의 사용이 증가하고 있는 반면, 모바일 앱 전반적으로 보면 앱의 붐은 사라지고 있다고 말할 수 있는 현상들이 벌어지고 있는데, 가령 2016 5월말 기준 모바일 앱 상위 15개의 다운로드 수는 전년 동월 대비 평균 20% 감소하였음


• 시장조사기관 컴스코어(comScore)에 따르면 미국 스마트폰 사용자의 절반은 20162분기에 다운로드 한 앱의 수가 하나도 없었음



<자료>comScore.


[그림 3] 2016 2분기 미국 앱 다운로드 수


뉴욕 타임즈는 대기업들은 고객 서비스 용이성을 위해 자체 개발한 전용 앱을 제공하고 있으나, 이는 사람들을 피곤하게 하는 일이며 사용자들은 점차 개별적으로 앱을 다운로드 하는데 싫증 내고 있다고 지적하고 있음


이런 분석 역시 점차 앱의 시대가 저물어 가고, 채팅봇을 이용한 상거래 시대가 올 것이라는 전망과 궤를 같이 하는 것이며, 마케팅 담당자들이 놓치지 말아야 할 지점임


◈ 그러나 채팅봇은 아직까지는 초보적이고 시험적인 단계에 있다는 점도 간과하지 말아야 하며, 이 점이 마케팅 담당자가 채팅봇에 대해 알아야 할 다섯 번째 항목임


채팅봇이 중요한 고객 참여 도구가 될 수 있기는 하지만 현재 메시징 앱의 채팅봇은 아직 기술적으로 계발되지 않은 상태라 할 수 없음


애플이 앱스토어를 처음 개설한 2008년 무렵에 등장했던 초기 아이폰 앱들과 유사한 단계로 볼 수 있는데, 당시 방귀 소리를 내는 앱이 최고 인기 앱이었던 점을 상기하면, 현재 채팅봇 역시 소위 방귀 앱의 단계에 있는 것으로 볼 수 있음


채팅의 기초를 이루는 자연언어 처리와 기계학습 등의 기술은 아직 진화의 도중에 있으며, 미리 입력된 대화 레퍼토리에 의존하지 않고 인간과 로봇이 매끈하게 대화할 수 있는 경지까지 도달하려면 좀 더 시간이 필요할 것임


MS의 채팅봇 테이(Tay)가 사용자들이 의도적으로 잘못 학습시킨 것에 영향을 받아 인종차별적 발언을 쏟아 내며 서비스 시작 16시간 만에 MS가 사과문을 발표하고 서비스를 중단시킨 사건은 현단계 채팅봇의 수준을 잘 보여주는 사건이라 할 수 있음


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 여섯 번째 항목은 채팅봇에 상거래와 마케팅의 미래가 있기는 하지만, 채팅봇이 인간을 대체하는 것은 아니라는 점


채팅봇이 웹, 메일, 웹사이트, 또는 인간을 아예 대체하는 것은 아니며, 복잡하지 않은 쇼핑을 지원하고, 이용자가 원하는 정보를 신속하게 제공하는 등 특정 용도에 적합한 형태로 폭넓게 대규모로 도입되어갈 것으로 보임


그러한 용도로 사용한다고 하며, 채팅봇은 실제로 다른 방법으로 고객과 접촉하는 것보다 더 우수한 서비스 제공 수단이 될 수 있음


현재 실행 중인 채팅봇들은 약간은 눈속임 같은 것이며, 채팅봇의 화제성에 편승할 목적으로 급작스럽게 만들어 진 것이 대부분일 지도 모르나, 메시징 앱을 통해 기업과 11로 커뮤니케이션 한다는 개념만큼은 확실히 정착되어 가고 있음


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 마지막 항목은 채팅봇을 개발할 때 마케팅 담당자와 IT 부서와 처음부터 긴밀하게 협력하지 않으면 안 된다는 점


IT 부서와 협력해야 하는 가장 큰 이유는 최대한 보안성을 보장하기 위해 채팅봇의 통신을 암호화하고 암호화 된 채널에만 채팅봇을 도입하는 것이 필요하기 때문


기업 시스템 내에서만 작동하는 사내 봇이라면 독자적인 암호화 채널에 설치할 수도 있지만 메시징 앱과 같은 일반용 채널에 채팅봇을 도입하고 싶다면 채팅봇의 보안은 해당 플랫폼의 보안 기능에 완전히 좌우될 수밖에 없음


채팅봇에 숨어있는 보안 문제는 또 있는데, 채팅봇이 인간을 모방하는 능력이 높아지게 되면, 해커가 피싱 등 소셜 엔지니어링 기법으로 해킹을 시도할 때 채팅봇이 악용될 위험이 다분하다는 점


예를 들어, 고객 및 공급업체를 본뜬 채팅봇을 이용해 표적 회사의 직원 사이에 메시징 앱을 통한 대화를 시작하고, 의사 소통 관계가 확립된 시점에서 채팅봇이 직원을 부추겨 악성 링크를 클릭하거나 기밀 정보를 넘기게 할 수도 있음


◈ 채팅봇의 운영을 위해서는 상당한 자원의 소요가 요구되므로, 채팅봇의 성공적 운영을 위해서는 사실 IT 부서와의 협력뿐만 아니라 전사적 차원의 협력과 지원이 필요함


채팅봇 운영에는 상당한 지원이 필요한데, 대부부의 IT 부서는 채팅봇 개발자가 테스트 및 지원을 담당하지만 가동 후 채팅봇 지원을 위한 자원까지 있는 것은 아님


채팅봇은 일반적으로 고객 라이프 사이클 전반에 걸쳐 관련 활동을 하기 때문에 지원에 필요한 자원의 규모를 우습게 보면 안되며, 부서별로 업무가 단절된 기업에서는 사내 예산 배분과 귀속 문제에 직면하게 될 지도 모름


채팅봇 전문가들은 가치 있는 채팅봇을 개발하는데 있어 최대의 난관은 기반이 되는 기술 요소를 기업의 전사 시스템과 통합하는 일이라고 지적함


채팅봇의 실용성을 떠받치는 기둥이 되는 자연언어 처리와 예측 분석 기술은 대부분의 IT 부서에서 보유하고 있는 핵심역량이 아니므로, 통합 업무가 결코 간단치 않음


기업의 채팅봇은 CRM, 헬프 데스크, 주문처리 시스템 등 기업의 데이터 시스템과 직접 연계되어야 하며, IT 부서는 기술 아키텍처를 포괄적으로 파악하여 기업의 커뮤니케이션 아키텍처 전체가 채팅봇과 원활하게 연계할 수 있도록 해야 함


◈ 새로운 마케팅 도구의 활용 능력이 기업의 성과에 직결되고 있으므로, 디지털 마케터들은 자신들에 적합한 채팅봇 활용 전략의 수립과 실행에 역량을 모아나가야 할 전망


기업의 비즈니스 활동이 디지털 환경으로 옮아 감에 따라, 새로운 기술의 등장에 따라 부상하는 디지털 마케팅 기술들은 기업 성과에 상당한 영향을 미치고 있음


채팅봇은 아직 개발 중에 있는 기술이나 이미 시도되고 있는 기술이기도 하며, 검색엔진 마케팅과 SNS 마케팅이 그랬던 것처럼 어느 순간 갑자기 기업의 핵심적인 마케팅 채널로 급부상하여 기업의 성패에 영향을 미치게 될 가능성도 매우 높음


기업의 마케팅 역량과 자산을 어떤 방식으로 채팅봇에 학습시키고 사용자와 소통하게 할 것인지, 이를 위해 기업의 IT 부서 나아가 전사적 차원에서 어떤 협력관계를 구축할 것인지에 대한 전략 수립이 디지털 마케팅의 핵심 과제로 부상하고 있음

※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1770호(2016. 11. 02 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

인간의 감정을 이해하는 인공지능 -목소리 톤에서 감정을 읽는다.pdf



[ 요 약 ]


기계가 인간의 감정을 이해하고 인간미 있는 동작을 취하고기계가 인간과 대화를 하며 그 자리의 느낌을 이해할 수 있다면인간이 기계를 바라보고 인식하는 태도는 아마 지금까지와는 사뭇 달라질 것임최근 인간의 감정을 이해하는 인공지능(AI)들이 등장하기 시작하며전통적인 기계와 인간의 관계가 바뀌려 하고 있으며인간과 AI의 공존의 전제조건이 될 사람과 기계 사이의 정서 관계가 생성되기 시작할 날도 그리 멀지 않을 것으로 예상되고 있음



[ 본 문 ]


◈ 이스라엘에 본사를 둔 벤처 기업 비욘드 버벌(Beyond Verbal)은 회사 명에서 알 수 있듯이 사람의 목소리를 분석해 감정과 성격을 추출하는 기술을 개발하고 있음


인간의 목소리는 콘텐츠를 전달할 뿐만 아니라 말하는 사람의 심정을 드러내 주는데, 문화인류학자들은 사람 사이의 대화에서 전달되는 정보의 90% 이상은 말이 아니라 목소리 톤이나 얼굴 표정, 몸짓 등 비언어적 요소에 있다고 말하고 있음


비욘드 버벌감정 분석(Emotions Analytics) 기법은 시장 조사에 응용되고 있으며, 음성에서 질병을 진단하는 연구에 적용되어 큰 성과를 올린 것으로 보고되고 있는데, 이런 연구는 궁극적으로 인간처럼 행동하는 시스템 개발과 연결될 것으로 기대됨



비욘드 버벌이 감정 분석 기술이 적용된 스마트폰용 앱 무디스(Moodies)를 출시하고 있기 때문에, 이 감정 분석 기술은 현재 누구나 이용해 볼 수 있음



<자료> Appstore.


[그림 1] 비욘드 버벌의 무디스 앱


앱을 실행시킨 다음 말을 하면 목소리 톤을 분석해 거기에 배어 있는 감정을 추출하는데, 육성이 아니라 녹음된 음성도 가능하므로 정치인이나 유명인들의 연설 혹은 발언을 입력해 감정 분석을 할 수도 있음


감정은 거짓말을 하지 않는다(Feelings Dont Lie)를 모토로 내세운 비욘드 버벌은 감정 분석 기술을 인정받아 지난 9월 초 300만 달러 투자를 유치하는 등 시리즈 A 펀딩에서 현재까지 총 700만 달러 이상의 투자를 받은 것으로 알려짐


◈ 무디스의 분석 능력을 보여주기 위해 비욘드 버벌은 오바마 미국 대통령이 히로시마 평화 공원에서 행한 연설이 앞쪽 3분을 입력한 후 분석된 결과를 공개하고 있음



<자료> Whitehouse.


[그림 2] 오바마의 히로시마 공원 연설


• 71년 전 구름 한 점 없이 맑은 어느 아침 날에 하들로부터 죽음이 떨어져 내렸고 세계는 달라졌습니다...(Seventy-one years ago, on a bright cloudless morning, death fell from the sky and the world was changed...)로 시작하는 연설은 묵직한 어조로 진행


전쟁의 비참함을 호소하는 연설이지만, 무디스 앱의 분석은 다른 견해를 나타냈는데 서두 부분 오바마 대통령의 심정은 동기 유발(Motivation)이라고 판정하며, 청중을 고무하기 위한 연설이자 동시에 문제에 대한 해결책을 모색하려는 것이라고 해석



<자료> Beyond Verbal.


[그림 3] 오바마 연설의 음성 분석 결과


 연설의 톤은 시간마다 바뀌어, 동기 유발 외에도 위엄(Dominance), 희망(Hope), 친밀감(Friendliness) 등의 분석 결과가 이어지며 연설 도중 심경의 변화가 계속해서 발생했음을 그래프와 함께 보여주고 있음


전반적으로 무디스 앱은 오바마가 해결책을 찾기 위한 노력이 진행 중이라는 것에 대해 심정적으로 긍정적인 평가를 내리고 있음(그래프의 녹색 영역, embracive)


그러나 한편으로는 희망을 전하려 해도 현실은 다르다고 느껴 감정적으로 우울한 평가를 내리는 측면도 있다고 분석하고 있음(그래프의 하늘색 영역, somber)


대부분의 사람에게는 무겁고 고뇌에 찬 연설로 들렸지만, 무디스 앱에 의하면, 오바마 대통령의 심중은 세계 평화를 호소하는 고무적인 감정과 프라하 선언 이후 부진한 핵무기 폐기에 대한 좌절감이 엇갈려 있었음을 알 수 있음


◈ 비욘드 버벌은 감정 분석 기술로 미국 공화당 대선 후보 도널드 트럼프가 폭스 뉴스의 메간 켈리와 진행한 공개 토론회에서의 답변을 분석한 결과도 공개하였음


무디스 앱의 감정 분석에 따르면, 트럼프의 답변에서 느껴지는 감정은 카리스마(Charisma), 창의성(Creativity), 장난끼(Playfulness), 추파(Flirtation), 따뜻함(Warmth) 등임



<자료> Beyond Verbal.


[그림 4] 트럼프 연설의 음성 분석 결과


•  토론회를 TV로 본 사람들은 대체로 트럼프의 발언이 매우 재미 있고 관객을 끌어 당기는 매력이 있다고 느꼈다고 하는데, 감정 분석의 결과 역시 재치 있고 장난기가 풍부하며 엔터테이너로서 탁월한 능력을 보유하고 있음을 보여주고 있음


트럼프는 발언 내용 중 부적절한 표현이나 편향된 인식이 많아 정치인으로서 평가는 대체로 높지 않으며 정치적 수완에 대해서는 물음표가 많이 붙지만, 비욘드 버벌은 트럼프 인기의 비밀이 바로 말의 정서적 측면에 있음을 확인해 주고 있음


◈ 비욘드 버벌은 감정 분석 기술을 기업용 솔루션으로도 제공하고 있는데, 감정에 관한 것이니만큼 주로 시장조사 목적에 활용되고 있음


기업은 제품의 브랜드와 디자인에 대해 조사할 때 감정 분석 기술을 이용해 실제로 어떻게 느끼는 지를 파악하려는 시도를 하고 있으며, 또한 사람들이 실제로 느끼는 광고 효과를 검증하는 데에도 이용하고 있음


조사에 응한 사람들에게 브랜드나 디자인, 광고물에 대한 정서적인 질문을 하고 답변을 녹음한 다음, 이 음성을 감정 분석 기술로 파악해 응답자들이 대상물에 대해 어떤 심정을 가지고 있는지를 분석하는 것임


기업이 알고자 하는 것은 표면적인 대답의 의미가 아니라 음성에 담겨 있는 감정이며, 사람이 겉으로 하는 말은 때론 진실과 다를 수 있고 건성으로 답하는 경우도 있지만 음성에 포함된 신호는 거짓을 말하지 않는다는 전제 하에 가능한 시도임


◈ 한편 현대인들 중에는 자신의 감정을 제대로 이해하는 것이 매우 어렵다고 느끼는 사람이 적지 않은데, 무디스 앱은 일상 생활에서 건강 관리의 도구로도 이용할 수 있음


가령 전화 통화 등을 앱으로 분석하여 그 때의 심정이 어떠했는지를 파악할 수 있는데, 자신은 힘찬 어투로 말했다고 생각했지만 앱으로 분석한 결과가 쓸쓸함(Loneliness)이나 불만족(Unhappy)으로 나올 수도 있음


무디스 앱으로 자신의 감정을 분석해 본 이용자들 중에는 실제로 자신이 생각한 마음가짐과 실제 분석 결과가 다른 것에 놀라는 경우가 많다고 함


건강이 좋지 않을 때는 일부러 약간 큰 목소리로 말하려는 경향이 있으나, 앱으로 분석하면 이런 노력은 실제로는 전혀 먹히지 않음을 알 수 있는데, 심정은 목소리의 크기나 음정과는 상관관계가 없어 이런 잔기술로는 상대를 속일 수 없음을 알 수 있음


건강에 관련한 문제는 빠른 조치가 필요한데, 앱 분석 결과가 좋지 않다면 기분 전환을 할 수 있는 휴식이나 여가 활동 등 건강 관리 활동을 할 필요가 있음


부정적 분석 결과를 받은 이용자들이 기분 전환 후 다시 앱을 실행하면 분석 결과가 긍정적으로 나타나는 경우가 많은데, 이런 사례를 통해 목소리에서 자신의 심리 상태를 판단하여 건강한 생활을 유지하는데 활용할 수 있다는 단서를 발견할 수 있음


실제 비욘드 버벌에 투자를 한 벤처캐피털들은 이들의 감정 분석 기술이, 측정 데이터를 통해 건강을 스스로 관리하는 계량화된 자아 운동(quantified self movement)과 궤를 같이 한다는 점에서 높은 평가를 한 것으로 알려져 있음


◈ 이 감정 분석 기법의 의학적 근거를 정립하기 위해, 비욘드 버벌은 메이요 클리닉(Mayo Clinic)과 스크립스(Scripps) 등 선진 의료기관과 공동 연구를 전개하고 있음


최근 연구 결과에 따르면, 목소리는 실제로 감정을 포함뿐만 아니라 건강 상태의 마커(marker, 표시자)를 내포하는 것으로 나타났다고 함


특히 피험자의 목소리가 심장 질환 관련 신호를 포함하는 것을 발견했는데, 음성 신호가 심장 질환의 바이오 마커가 되므로 음성을 녹음하면 질병을 판정 할 수 있다고 함


이보다 앞서 음성은 자폐증이나 파킨슨병과도 관련이 있음이 밝혀지기도 했으며, 또한 음성과 우울증 및 난독증과의 관계도 해명되고 있는데, 이로써 우리가 하는 말은 건강을 비추는 거울이기도 하다는 점이 규명되고 있음


◈ 음성과 질병의 관계를 의학적으로 해명한 것은 비욘드 버벌이 처음인데, 최근 들어 스마트폰이나 웨어러블 기기로 질병을 진단하는 기술들이 속속 등장하고 있음


 애플은 임상 시험을 위한 플랫폼인 리서치킷(ResearchKit)을 제공하고 있는데, 의료기관은 이 플랫폼을 이용해 단시간에 대규모 임상 시험을 실시할 수 있고, 임상 시험에 참여하는 피험자는 리서치킷에서 제공되는 앱으로 간단한 시험을 실시할 수 있음


파킨슨병에 대한 임상 시험 앱으로는 엠파워(mPower)가 주목 받고 있는데, 이는 비영리 단체인 세이지 바이오네트웍스(Sage Bionetworks)가 개발한 것으로, 피실험자들은 아이폰용 앱에서 지시에 따라 몇 가지 조작을 하면 파킨슨병 여부를 판정 할 수 있음


피험자들은 세 가지 작업을 지시 받는데, 손가락으로 버튼을 누르고 마이크에 ~하고 소리를 내며, 기억력을 시험하는 문제에 답하게 되는데, 피험자들의 테스트 결과를 집계하여 대규모의 파킨슨병 임상 시험을 전개 할 수 있게 되었음



<자료> Sage Bionetworks.


[그림 5] 파킨슨병 임상시험 앱 mPower


◈ 비욘드 버벌은 현재의 컴퓨터는 인간의 감정을 이해할 수 없는 감정맹(Emotional Blind)이라며, 자신들의 최종 목표는 기계에 인간의 감정을 이해시키는 것이라 말하고 있음


비욘드 버벌의 목적은 기계가 감정의 수준에서 인간과 커뮤니케이션 하는 것인데, 이를 위해서는 기계가 인간의 감정을 실시간으로 파악하는 것이 필요하며, 이 정보를 시스템에 피드백 함으로써 컴퓨터가 이용자의 감정에 따라 대응하도록 해야 함


현재 애플 시리(Siri)지금 내가 무슨 일을 하면 좋을까?라고 물어 보면 재미있는 질문이군요(Interesting question)라는 엉뚱한 대답을 받게 됨


만약 시리가 사용자의 말투에서 감정을 이해하게 된다면 인간과 같은 반응을 기대할 수 있는데, 일이 바빠서 피곤하다고 파악하면 시리가 잠깐 휴식을 취하고 차를 마시자고 제안할 수도 있고, 우울할 때는 좋아하는 곡을 재생해 줄 지도 모름



<자료> The Wall Street Journal


[그림 6] 비욘드 버벌 음성 분석 기술 개요


  애플 시리 뿐만 아니라 아마존 에코에 내장된 인공지능 알렉사(Alexa)나 구글홈에 내장된 구글 어시스턴트(Google Assistant)도 사람의 목소리에 들어있는 감정을 이해하고 인간미가 느껴지는 기능을 개발하고 있을 것으로 보이는데, 비욘드 버벌의 기술은 감정을 이해하는 컴퓨터 구현의 기초가 됨


인간과 기계, 인간과 AI의 공존 시대를 이야기하지만, 컴퓨터가 아무리 지능이 뛰어나도 감정을 이해하지 못하는 깡통일 뿐이라는 인식은 인간과 기계 간의 관계 형성에 제일 큰 장벽인 것이 사실


만일 인공지능들이 감정 분석을 통해 인간의 감정을 이해할 수 있다고 하면, 그것이 진정한 감정의 이해인지에 대한 논란은 다시 벌어지겠지만, 최소한 지금까지와는 다른 인간과 기계 간의 감정적 관계 형성이 시작될 수 있을 것이며, 이는 새로운 기계시대로의 진입을 알리는 또 하나의 징표가 될 수 있을 것