※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1838호(2018. 3. 21. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

아마존과 구글의 스마트홈 경쟁, 거실 다음 격전지는 ‘현관’.pdf



ž 스마트홈 주도권 확보를 위한 아마존닷컴 구글의 싸움이 거실에서 현관으로 확산될 조짐을 보이고 있는데, 먼저 움직임을 보인 것은 구글 산하 네스트 랩스(Nest Labs)


Ø 양사는 거실 주도권을 놓고 이미 스마트 스피커와 스마트 TV 제품으로 격돌한 바 있으며, 이제 그 다음을 놓고 새로운 격돌을 준비하고 있는데 전장은 현관이 될 것으로 보임


Ø 미국에서는 원래 초인종 자체가 없는 집이 많았는데, 최근 몇 년 새 카메라 기반의 스마트 초인종 시장이 인기를 모으고 있음



Ø 스마트 초인종을 제조하는 스타트업이 잇따라 등장했을 뿐 아니라, 구글 산하의 네스트 랩스도 2017 10월에 시장 진출을 발표했으며, 올해 3월 초에 제품 출하를 시작하였음


Ø 네스트는 2014 6 보안 카메라 제조업체인 드롭캠(Dropcam)를 인수해 보안 카메라 시장에 진출했으며, 이후 이를 기반으로 201710월에 스마트 초인종 네스트 헬로(Nest Hello)를 발표하였음


<자료> Slash Gear


[그림 1] 네스트 랩스의 네스트 헬로


Ø 스마트 헬로 초인종은 스마트폰 앱과 클라우드 보안 서비스인 네스트 어웨어(Nest Aware)를 연계한 카메라 기반의 제품으로 가격은 229 달러임


ž 네스트 헬로는 이미지 인식 기능을 탑재하고 있으며, 구글의 음성인식 비서인 구글 어시스턴트와 연계되어 다양한 스마트 기능을 제공할 수 있음


Ø 방문객이 네스트 헬로 초인종을 누르면 사용자의 스마트폰에 알림이 통보되고, 사용자는 앱을 통해 방문자가 누구인지 확인하고 대화할 수 있음


Ø 네스트 헬로는 카메라로 촬영한 사진이나 동영상을 모두 클라우드 서비스에 보내고 이미지 인식에 의해 인물 식별을 수행하는데, 문 앞에 가족과 친구, 수상한 사람이 나타나면 이를 인식하여 사용자의 스마트폰에 알림 및 경고를 보냄


Ø 미국에서는 택배 기사가 화물을 문 앞에 두고 가는 경우가 적지 않고, 이를 노리는 좀도둑들도 많은데 네스트 헬로는 이미지 인식을 통해 처음 보는 수상한 사람이라고 판정하면 음성으로 경고를 내보냄


Ø 반대로 카메라에 등록된 얼굴로 파악한 경우에는 구글의 음성 비서 구글 어시스턴트(Google Assistant)가 방문자의 이름을 음성으로 사용자에게 알려줌


[1] 구글 네스트 랩스와 아마존의 스마트홈 보안 제품 관련 주요 동향

시기

업체

주요 동향

2014 6

네스트

- 보안 카메라 제조 업체 드롭캠(Dropcam) 인수. 후에 네스트 캠(Nest Cam)으로 개칭

2015 10

네스트

- 스마트 락 제조업체 예일(Yale)과 제휴

2017 9

네스트

- 스마트 초인종 네스트 헬로(Nest Hell)와 보안 시스템 네스트 시큐어(Nest Secure) 발표

2017 10

아마존

- 보안 카메라 아마존 클라우드 캠(Amazon Cloud Cam)과 부재 중 댁내 택배 배달 서비스 아마존 키(Amazon Key) 발표

2017 12

아마존

- 스마트 초인종 스타트업 블링크(Blink) 인수

2018 1

네스트

- 예일의 네스트 예일 록(Nest Yale Lock) 인수, 2018 1분기 출하 계획 발표

2018 2

아마존

- 스마트 초인종 스타트업 링(Ring) 인수

<자료> IITP 정리


ž 이러한 구글의 움직임에 아마존도 정면으로 대응하고 나섰는데, 최근 들어 스마트 초인종 스타트업 두 곳을 연이어 인수하였음


Ø 아마존은 2017 10월 보안 카메라 아마존 클라우드 캠(Amazon Cloud Cam)을 발표함과 동시에 아마존 쇼핑몰의 배달원이 주문자가 부재한 빈 집의 스마트 잠금을 해제하고 집 안에 들어가 택배를 전달할 수 있게 하는 아마존 키(Amazon Key) 서비스도 시작하였음


<자료> Amazon.com


[동영상] 아마존 키 서비스 이용 장면


Ø 아마존 클라우드 캠 서비스는 배달원은 전용 앱을 이용해 스마트 잠금을 해제 할 수 있고, 사용자는 빈 집에 들어간 배달원을 모니터링 할 수 있게 해 줌


Ø 아마존은 최근 들어 카메라 초인종 제조 업체를 연이어 사들였는데, 2017 12월에는 블링크(Blink), 2018 2월에는 (Ring)을 인수하였음


Ø 먼저 인수한 블링크는 2009년에 설립된 보안 카메라 기업으로 2018년에 카메라 기반 스마트 초인종을 출시할 예정임


Ø 올해 2월에 인수한 링은 이미 카메라 초인종을 판매하고 있는 기업으로, 보도에 따르면 링의 인수 금액은 10억 달러에 이른다고 함


ž 아마존과 구글 양사는 최근 AI(인공지능) 스피커를 스마트홈의 허브로 자리매김하고, 자신들의 AI 비서 및 클라우드 서비스와 연계되는 가전 제품을 늘리려 애쓰고 있음


Ø 이런 경쟁 구도 하에서 스마트 스피커, 스마트 TV에 이어 보안 카메라와 카메라 초인종 등 스마트홈 보안 제품은 아마존과 구글이 맞대결하는 새로운 가전 제품이 되었음


Ø 구글은 네스트 헬로를 예약 주문한 사람에게 49 달러 상당의 소형 스마트 스피커 구글홈 미니(Google Home Mini)를 무료로 번들하는 캠페인을 전개하고 있음


Ø 네스트 헬로는 네스트 어웨어와 구글 어시스턴트가 연계되어 있으므로, 스마트폰이 없더라도 구글 어시스턴트를 이용할 수 있도록 구글홈 미니를 번들한 것임


Ø 구글은 네스트 시큐어 카메라와 구글 어시스턴트, 나아가 스마트 TV 단말기인 크롬캐스트(Chromecast)를 연계시키는 구조도 준비하고 있음


Ø 가령 사용자가 구글 어시스턴트에, 좋아 구글, 카메라의 영상을 비춰 줘라고 말을 건네면, 보안 카메라가 촬영한 라이브 동영상을 크롬캐스트에 연결된 TV에 표시해 주는 것임.


Ø 이러한 연계 구상은 아마존 클라우드 캠과 아마존의 AI 비서인 알렉사(Alexa), 그리고 스마트 TV 단말기인 아마존 파이어 TV(Amazon Fire TV)로도 실현할 수 있음


Ø 아마존 역시 구글의 네스트 어웨어에 대항하는 클라우드 보안 서비스 클라우드 캠 서브스크립션을 제공하고 있으며, 클라우드 기반의 이미지 인식 기술에 의한 인물 특정 기능 등도 제공하고 있음


ž 양사의 경쟁에서 향후 관전 포인트는 스마트 락(Smart Lock)인데, 사실 보안 카메라와 스마트 락의 연계 구상을 먼저 발표한 것은 구글이지만 실현은 아마존이 빨랐기 때문


Ø 구글은 2015년에 미국의 오래된 자물쇠 제조업체 예일(Yale)과 제휴하고, 예일의 스마트 락을 네스트 시큐어 카메라와 연계시킬 계획임을 발표했으나 구현에 어려움을 겪었고, 예일의 네스트 지원 스마트 락 판매는 2018 1분기 내로만 알려져 있음


Ø 이에 비해 아마존은 2017 10월 아마존 키 서비스를 시작한 시점에, 예일과 유사한 미국의 오랜 자물쇠 제조업체 퀵 세트(Kwikset)가 판매하는 스마트 락과 아마존 클라우드 캠의 연계를 구현했는데, 후발주자인 아마존이 실행력에서 구글을 앞선 것임


Ø 게다가 스마트 락의 기능 면에서도 아마존이 구글을 크게 앞선다는 평가인데, 아마존 키와 같은 기능의 서비스를 구글은 아직까지 제공하지 못하고 있기 때문


Ø 아마존은 아마존 키 서비스를 플랫폼으로 성장시킨다는 복안인데, 아마존닷컴 쇼핑몰의 제품 배달원뿐만 아니라 홈 클리닝 서비스 등 다른 직종의 서비스 직원들도 아마존 키 방식을 이용하여 고객의 빈 집에 들어갈 수 있게 하겠다는 계획을 밝힌 바 있음


Ø 홈 시큐리티 제품은 보안을 위한 필수 요소이며, 재산상 및 신체상, 정신적인 피해를 막을 수 있는 대신 편의성을 높이는 것은 어려운 일이었음


Ø 아마존 키 서비스는 홈 시큐리티 제품에 편의성을 향상시킨 것으로, 지금까지 홈 시큐리티 제품에 관심이 없었던 사용자의 구매욕을 자극하고 있는데, 이는 홈 시큐리티 분야에는 아직 후발주자들에게 충분한 기회가 있음을 시사


ž 한편 네스트의 주종목인 스마트 온도계 분야에서도 아마존과의 정면 대결이 조만간 시작될 것으로 보여, 스마트홈을 둘러싼 구글과 아마존의 경쟁은 더욱 가열될 전망


Ø CNBC에 따르면 아마존은 3 7일 산하의 알렉사 펀드(Alexa Fund)를 통해 캐나다의 스마트 온도계 제조업체 에코비(Ecobee)에 투자하였음


Ø 스마트 온도계는 가령 에어컨과 연계하여 사용자가 음성으로 에어컨을 제어 할 수 있도록 하고, 기계학습에 의해 사용자의 실온 취향 등을 학습할 수 있게 한 것임


Ø 보도에 따르면 이번 에코비 투자 즈음에 아마존은 자사 쇼핑몰 사이트에서의 네스트의 스마트 온돈계 판매를 중단했는데, 아마존과 구글의 스마트홈 경쟁이 점차 과열 양상을 띨 조짐이 보이고 있음

댓글을 달아 주세요

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1828호(2017. 12. 27. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

사람 같이 대화하는 AI, ‘소셜봇’ 개발을 위한 아마존의 도전.pdf



[ 요 약 ]


아마존웹서비스 리인벤트 컨퍼런스에서는 아마존의 인공지능 가상 비서 알렉사(Alexa)와 관련한 두 가지 흥미로운 발표가 있었음하나는 알렉사를 기업 업무 시스템과 연결해 직원들의 업무 효율성을 높여 주는 비즈니스용 알렉사알렉사를 통해 회의실 관리나 재고 관리 등이 가능함을 보여주었음또 하나는 알렉사 프라이즈로 사람처럼 대화하는 AI의 개발을 위해 아마존이 주최한 콘테스트였는데수상작들은 아직 미흡하나 사람과 흥미로운 대화가 가능할 수 있음을 보여주었음



[ 본 문 ]


ž 11월말 열린 아마존웹서비스 리인벤트(AWS re:Invent) 2017에서는 두 가지 이벤트가 눈길을 끌었는데, 우선 아마존은 비즈니스용 알렉사(Alexa for Business)를 발표하였음


Ø 비즈니스용 알렉사는 음성 인식 기능을 이용해 업무 자동화를 한 것으로, 음성을 통해 명령을 내리고 필요한 정보를 전달받음으로써 업무 처리의 시간 효율성을 높이는 것이 목적임


<자료> Amazon


[그림 1] 비즈니스용 알렉사 스타터 키트


Ø 소비자용 음성 비서였던 알렉사를 기업용으로 전환한 서비스로, 규칙이 정해진 업무나 단순한 업무를 중심으로 가상 비서가 처리를 대신함으로써 업무 환경을 보다 직원 친화적으로 조성하여 핵심 업무에 집중할 수 있도록 한다는 것


Ø 가령 알렉사가 탑재된 인공지능 스피커 아마존 에코(Echo)를 회의실에 두면 방 예약 및 화상 회의 연결을 말로 지시 할 수 있으며, 문서 출력실에 둔다면 용지가 떨어졌을 때 에코에게 주문을 지시할 수 있어 사무 업무가 편리해 질 수 있음


Ø 아마존은 비즈니스용 알렉사 스타터 키트로 우선 에코, 에코닷, 에코 쇼 3가지 디바이스를 선보였는데, 이 중 에코 쇼(Echo Show)는 기업용 서비스에서 처음 선보이는 디바이스 모델임


Ø 비즈니스용 알렉사는 개인 이용 모델(Enrolled User)와 공유 모델(Shared Device)이 있는데, 전자는 모든 직원이 책상에 두고 개인 업무에 이용하는 형태이며, 후자는 회의실 등 공공 장소에 두고 여러 직원이 공동으로 사용하는 형태임


Ø 현재 소비자용 알렉사가 무료인 반면, 기업용 알렉사 이용은 유료 서비스인데, 요금은 공유 모델이 디바이스마다 월 7달러이고, 개인 이용 모델은 유저 당 월 3달러이며, 기업의 IT 부서에서 디바이스와 이용자 관리를 하게 됨


Ø 비즈니스용 알렉사는 우선 영어, 독일어, 일본어 등 3개국 언어를 지원하지만, 언어별 음성인식 기술의 진전 정도에 따라 이용 국가는 점차 늘어나게 될 것임


ž 아마존이 제시한 비즈니스용 알렉사의 대표적 활용 예는 회의실 관리인데, 시스코, 폴리컴 등 기업 커뮤니케이션 솔루션 업체들과 연계해 알렉사에 회의실 관리 기능을 추가하였음


Ø 우선 각 직원들은 알렉사를 탑재한 기기를 책상에 두고 일정관리 비서로 활용할 수 있는데, 알렉사에게 회의 일정을 질문해 확인할 수도 있고, 다른 팀과 미팅 일정을 잡아달라고 요청하면, 이 요청을 다른 팀의 비서에게 전달한 후 협의하여 일정을 잡아 줌


Ø 회의실에서도 알렉사를 비서로 활용할 수 있는데, 화상회의를 시작해 달라고 요청하면 알렉사가 지정된 번호로 전화를 걸게 되고 모니터에 회의 참가자의 얼굴이 비춰지게 됨


<자료> Amazon


[동영상] 비즈니스용 알렉사의 다양한 활용: 회의 진행 보조와 안내 데스크 역할 등


Ø 프리젠테이션 중에 자료가 필요하다면 알렉사에게 원하는 자료를 보여 달라고 지시할 수 있고, 알렉사는 지난달 매출 실적 등과 같이 업무 시스템에 요청하여 받은 자료가 화면에 보여지도록 처리하게 됨


Ø 회의실 외에도 다양한 장소에 설치하여 활용 방안을 만들어 나갈 수 있는데, 가령 사무실 입구에 알렉사 탑재 기기를 설치해 두면 알렉사가 안내 데스크의 역할을 할 수 있어, 만나고 싶은 직원의 방 위치를 묻는 질문에 답해줄 수 있음


Ø 문서 처리실에 설치해 두면 용지 부족 시에 종이 주문을 명령하는 것 외에도, 컬러 출력 작업을 긴급히 해야 하는데 해당 컬러 프린터에서 흑백 인쇄 작업이 진행 중일 경우, 해당 작업을 흑백 프린터로 옮겨 인쇄할 것을 명령하는 등의 일도 할 수 있음


ž 알렉사의 비즈니스 솔루션은 아마존의 파트너 기업들이 제공하게 되는데, 세일즈포스닷컴, 폴리컴, 컨커 등 유명 기업용 솔루션 업체 외에도 많은 스타트업들이 파트너로 참여 중


Ø 스타트업 (Teem)은 이미 많은 기업에서 회의실 관리에 사용하는 솔루션을 제공 중이며 회의실 입구에 디스플레이를 설치해 룸 이용 현황을 보여주는데, 알렉사와 연동해 음성을 통한 회의실 관리 기능을 제공할 수 있게 되었음


Ø 회의실을 예약 할 때는 방에 설치되어 있는 에코 디바이스에 알렉사, (Teem)에 이 방 예약을 요청해 줘라고 명령하고, 회의실 사용을 시작하면 알렉사 팀에게 이 방 체크인을 요청해 줘라고 말하며, 회의 시간 연장 요청 등도 명령할 수 있음


Ø ERP 솔루션을 제공하는 스타트업 애큐매티카(Acumatica)는 알렉사를 이용하여 재고 관리 시스템을 음성으로 제공하기 때문에, 알렉사, 애큐매티카에 노트북 재고가 얼마나 있는지 물어봐 줘 등과 같이 명령할 수 있으며, 답을 듣고 재고량이 부족하다고 판단하면 알렉사, 애큐매티카에 10개를 주문해 달라고 해줘라고 명령할 수 있음


Ø ERP와 같은 기간 시스템에 접속하기 위해서는 알렉사의 인증 기능을 강화하는 것이 과제가 되는데, 알렉사의 인증 방식은 4자리의 PIN(개인식별번호)을 말로 이야기하는 것이 일반적이나 PIN을 다른 사람이 들을 위험이 있어 성문 등 생체 인식 인증을 준비 중이라고 함


Ø 고급 리조트 호텔인 윈 라스베이거스(Wynn Las Vegas)는 모든 객실에 아마존 에코를 도입하여 활용 중인데 총 4,748 개의 에코가 설치되어 있어 손님들은 호텔과 객실 정보를 프런트가 아닌 에코에 물어볼 수 있음




<자료> Wynn Las Vegas


[동영상호텔 전 객실에 배치된 아마존 에코


Ø 또한 숙박 고객은 음성으로 객실 시설을 컨트롤 할 수 있는데, 알렉사 나 들어 왔어라고 말하면 방의 전등이 켜지며, 알렉사 뉴스 틀어줘라고 말하면 TV가 켜지고 뉴스 채널이 선택됨


Ø 알렉사가 컨시어지 서비스가 되어 손님들을 지원하게 되는 것인데, 호텔 측은 숙박객이 프런트에 전화하는 횟수가 줄어 비용 절감 효과가 있는 것으로 분석하고 있음


ž 미국에서는 AI 스피커가 소비자들에게 대체로 좋은 평을 얻어가고 있는 중이기 때문에, 명령 처리 구현이 상대적으로 용이한 기업용 알렉사 역시 반응이 좋을 것으로 예상됨


Ø 아마존의 워너 보겔스 CTO는 음성을 통해 직원과 시스템이 자연스럽게 상호작용 하는 것이 AI가 기업의 비즈니스에 가져올 첫 번째 파괴적 혁신이라며, 대화형 컴퓨팅이 미래에 어울리는 자연스러운 사용자 환경이라고 비즈니스용 알렉사의 출시 의의를 설명하고 있음


Ø AI 기반 대화형 컴퓨팅은 기술적 측면으로만 보면 소비자용 서비스보다 처리 업무가 구조화되어 있는 기업용 서비스에서 보다 용이하게 구현할 수 있음


Ø 소비자용 AI 음성인식 서비스에서는 일정관리 같이 정해진 태스크를 처리해야 하는 경우도 물론 있지만 이용자의 상황과 감정에 맞게 대화를 나누는 것 자체가 보다 중요한 경우가 있기 때문에 보다 고도의 지능적인(인간적인) AI 기술의 구현이 뒷받침되어야 함


Ø 반면 기업용 음성인식 서비스는 직원의 태스크 처리 지원이 본질적인 기능이기 때문에, 즉 업무 처리를 손이 아닌 로 한다는 인터페이스의 성격이 강하기 때문에 명령어를 정확하게 인식하는 것이 중요하며 사실 인공지능적 기능은 그리 필요하지 않음


Ø 명령어만 올바로 인식이 된다면 그 다음은 기업의 업무 시스템에 그 명령어를 전달하기만 하면 되고, 업무 시스템들이 처리해 준 결과를 다시 이용자에게 전달해주면 되기 때문


Ø 인공지능 스피커를 이용해 본 경험이 있는 직원들이라면 생소함 없이 비즈니스용 알렉사를 이용할 수 있을 것이며, 기업에서 알렉사는 정해진 태스크만 처리하면 되므로 보안 이슈 등으로 인해 인터페이스에 노이즈 발생이 없다면 도입 효과는 높을 것으로 전망해 볼 수 있음


ž AI 스피커와 관련한 아마존의 목표 대화하는 AI의 개발이기 때문에, 이번 리인벤트 2017에서 비즈니스용 알렉사보다 눈길을 끈 것은 아마존의 알렉사 프라이즈 콘테스트임


Ø 알렉사 프라이즈(Alexa Prize) 20분간 사람과 대화할 수 있는 채팅 로봇 개발을 목표로 아마존이 총상금 250만 달러를 내걸고 주최한 경진 대회로 올해가 첫 행사였는데, 올해 9월부터 2개월간 진행되었고 리인벤트 2017 컨퍼런스에서 시상식이 진행되었음


Ø 22개국에서 100개 이상의 대학 팀이 기술을 겨룬 이번 대회에서는 워싱턴 대학 팀이 우승을 차지해 50만 달러의 상금을 받았음


<자료> Amazon


[그림 2대화 AI 개발을 위한 알렉사 프라이즈


Ø AI에게 대화 기법은 매우 어려운 일이어서 영원히 목표에 도달할 수 없다는 의견도 있을 정도인데, 아마존은 알렉사를 통해 이 목표에 다다를 기술을 연구하고 있지만 대학 팀의 연구 참가로 젊은 두뇌들에 의한 돌파구를 기대하며 이번 콘테스트를 개최하였음


ž 아마존은 대화하는 AI소셜봇(Socialbot)이라 부르는데, 소셜봇은 채팅봇으로도 불리며, 알렉사의 스킬(Skill, 앱스토어의 앱에 해당) 중 하나로 분류됨


Ø 소셜봇은 에코를 통해 다양한 화제에 관해 이용자와 음성으로 대화하는데, 연예, 스포츠, 정치, 패션, 기술 등을 대화 화제로 자연스럽게 대화가 진행되도록 하는 것이 개발 목표임


Ø 참가 팀은 아마존에서 제공하는 음성 응용프로그램 개발 환경(Alexa Skills Kit)을 사용하여 소셜봇을 개발하게 되며, 심사위원이 소셜봇과 20분간 대화한 후 회화 능력을 평가하게 됨.


Ø  구체적으로 소셜봇이 화제의 일관성을 가지고 있는지(Coherently), 상대를 끌어 당기는지(Engaging) 등의 능력을 평가하는데, 이는 튜링 테스트(AI가 인간인 척하는 능력의 시험)가 아니고, 어디까지나 회화 능력을 시험하는 것임


Ø 상위 3개 팀의 소셜봇은 공개되어 있으며 아마존 에코에 설치하여 직접 대화해 볼 수 있는데, 실제로 소셜봇과 이야기해 본 사람들은 대체로 기술력이 아직 미완성이어서 대화가 어눌하고 서툴다는 평을 내놓고 있음


Ø 그러나 소셜봇이 꺼내 놓는 주제가 재미있고 입담도 느껴져 대화에 매료되었다는 평도 있으며, 인간 수준에 도달하려면 아직 시간이 걸리겠지만 큰 잠재력이 있음을 실감했다는 의견도 많음


[동영상] 스포츠를 주제로 한 소셜봇과 대화 장면


ž 우승을 차지한 워싱턴 대학 팀의 채팅봇을 비롯해 소셜봇은 이용자의 질문에 반응하는 것뿐만 아니라 AI가 습득한 지식을 기반으로 대화를 주도해 나갈 수 있는 것이 특징임


Ø 아마존 에코에서 소셜봇을 시작하면 소셜봇은 우선 기분은 어떻습니까와 같이 가벼운 인사를 한 후 대화에 들어가는데, 대화 기법에서는 이를 아이스브레이커(Icebreaker)라 부르며 갑자기 본격적인 대화에 들어가는 것이 아니라 우선 딱딱한 분위기를 풀어 주기 위한 것임


Ø 분위기가 풀어졌다고 생각하면 소셜봇은 상대가 흥미를 가질 만한 대화의 주제를 제시하는데 이는 대화 기법 중 토픽 제안(Topic Suggestion)에 해당하는 것으로, 소셜봇은 처음 대화를 갖는 상대에게는 일반적으로 받아들여질 수 있는 화제를 제시함


Ø 소셜봇이 제시한 몇 가지 주제 중에서 가령 인공지능에 관해 이야기하자고 대답하면 소셜봇은 페이스북이 이용자가 올린 사진에서 그 사람의 감정을 추측하는 AI를 개발하고 있다는 등 인공지능과 관련한 몇 가지 재미있는 이야기들을 말해 줌


Ø 이는 대화 기법 중 지식 섭취(Knowledge Ingestion)에 해당하며, 소셜봇은 최신 화제거리를 항상 받아보기 때문에 대화에서 깊은 지식을 내비치며 상대를 끌어 당길 수 있는데, 이는 사람 사이의 대화에서 신선한 화제가 많은 사람이 상대에게 호감을 주는 것과 같은 것임


Ø 소셜봇의 이야기에 대해 어떻게 그런 구조가 가능하지?라고 되묻거나 짓궂은 질문을 던지게 되면 소셜봇은 아직 제대로 답을 하지 못하는 경우가 많음


Ø 상대가 관심을 가지고 있는 사안에 대해 심도 있게 설명하는 것을 대화 기법에서는 심해 잠수(Deep Dive)라고 부르는데, 딥 다이브가 잘 되어야 이야기가 깊어지고 대화가 진행되는데, 현 단계의 소셜봇은 딥 다이브 단계의 대화가 잘 이루어지지 않고 있음


Ø 소셜봇은 비록 대답을 못하더라도 거기서 그치지 않고 인공지능과 관련한 이야기를 계속할까요? 등의 질문을 하는데, 이는 대화 기법 중 대화 주도(Leading Conversation)라 하는 것으로 대화가 중단될 것 같은 경우에 대화를 이끎으로써 계속 이어지게 하는 것임


Ø 소셜봇은 종종 사용자가 원하는 주제를 무시하고 자신이 준비한 이야기를 하는 모습을 보이는데 비록 상대가 소셜봇이라는 것을 알지만 기분이 좋게 느껴지지 않는다는 평을 듣고 있으며, 반대로 사람이 주제를 갑자기 바꾸면 어떻게 된 거냐며 불안한 정서를 내비친다고 함


Ø 소셜봇 이용자들은 대체로 아직 소셜봇과 인간처럼 대화하는 것은 어렵지만 대화의 내용은 재미있고 대화 시간은 10~15분 정도인 것으로 평가하고 있는데, 아마존의 목표가 20분간 대화인 데에서 알 수 있는 아직 연구 개발은 더 지속되어야 할 것으로 보임


[동영상] 영화를 주제로 한 소셜봇과 대화 장면


ž 소셜봇은 아마존의 음성 응용프로그램 개발 환경에서 만들어지므로, 연구 팀은 아마존이 제공하는 음성 인식과 음성 합성 기능을 이용할 수 있음


Ø 음성 인식(Automatic Speech Recognition) 기능은 음성을 텍스트로 변환하는 과정에 이용하며, 음성 합성(Text-to-Speech) 기능은 텍스트를 음성으로 변환하는 과정에 이용하는데, 이를 통해 사람이 하는 말을 시스템이 인식하게 되고 소셜봇의 의도가 알렉사의 목소리로 나오게 됨


Ø 연구 팀들은 음성 인식과 음성 합성의 중간 프로세스에 해당하는 대화 기술을 개발하고 그 기량을 견주게 되는데, 아마존은 원활하게 대화하는 것은 물론이거니와 소셜봇의 입담이나 캐릭터 등도 개발도 목표로 하고 있음


Ø 연구자들은 소셜봇이 흥미로운 주제를 이야기하는 것뿐만 아니라 자신의 주장을 가지고 의견을 말할 수 있는 단계가 시야에 들어왔다고 말하고 있으며, 상대방의 말에 농담으로 답변할 수 있는 단계가 되면 완성도가 부쩍 향상될 것으로 보고 있음


ž 자율운전 자동차 기술이 대학 간의 경쟁을 통해 급진전을 이루었듯, 아마존은 대학의 연구에서 대화하는 AI의 개발이라는 거대한 도전의 목표가 달성될 것을 기대하고 있음


Ø 아마존 에코와 구글 홈의 보급이 폭발적으로 증가하고 있고, 비즈니스용 알렉사가 출시되어 이제 기업에서의 활동도 점차 늘어나게 된다면, 이미 대학에서 뜨거운 연구 주제로 부상한 AI에 대한 연구 열기는 더욱 높아질 것임


<자료> Greg Shank


[그림 3] 알렉사 프라이즈에 참가한 대학들



Ø 자율운전차 기술도 대학 연구팀의 참여가 늘어나며 거대 IT 기업과 자동차 제조업체에 우수 인재들이 진출하게 되고, 새로운 자율운전 관련 하드웨어와 소프트웨어 스타트업들이 등장하며 단기간에 급진전을 이룬 바 있음


Ø 아마존은 음성인식 인공지능 분야에서도 이 같은 연구 열기가 재현되기를 기대하며 2018년에도 알렉사 프라이즈 콘테스트를 준비하고 있음


Ø 또한 대학의 연구 역량과 연계하려는 이런 시도는 비단 아마존뿐 아니라 AI 가상 비서 시장을 놓고 경쟁 중인 구글, MS, 애플 등을 통해서도 전개될 가능성이 높음


Ø 대화하는 AI의 개발이 과연 가능할 것인지, 대화하는 AI가 과연 얼마나 인간에 가까워질 수 있을 것인지, 2018년에 또 하나의 인류의 위대한 도전(Grand Challenge)이 본격화될 것으로 보임

댓글을 달아 주세요

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1821호(2017. 11. 8. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

도쿄 모터쇼에 비친 일본 자동차 업계의 스마트 IT 접목 현황.pdf



[ 요 약 ]


도쿄 모터쇼가 한동안 중국의 모터쇼에 밀리는 통에 일본 자동차 업계의 영향력이 많이 줄어든 것처럼 보였으나올해 일본 자동차 업계는 세계 시장에서 역대급 실적을 달성하고 있으며 이에 따라 올해 도쿄 모터쇼에는 예전에 비해 많은 관심이 모였음일본은 그 동안 스마트 IT의 도입에 뒤쳐진다는 인상이 있었으나이번 도쿄 모터쇼에서는 자율운전과 AI 외에도 자동차에 IT를 다양하게 접목하려는 시도가 다수 선보이며 스마트 카 시대에도 일본차의 경쟁력이 이어질 수 있음을 시사



[ 본 문 ]


ž 최근 일본 자동차들은 3대 시장에서 큰 성과를 거두며 과거의 영광을 재현하고 있는데, 10월 말 개최된 도쿄 모터쇼는 일본차들의 저력을 다시 한번 확인시켜 주었음


Ø 원래 도쿄 모터쇼는 프랑크푸르트, 디트로이트, 파리, 제네바 모터쇼와 함께 세계 5대 모터쇼로 꼽혔으나 거대 내수 시장을 등에 없고 밀어 부치는 상하이와 베이징 모터쇼에 밀리면서 어느 순간 관심 밖으로 밀려나 있었음


Ø 올해도 세계 자동차 시장의 신성 테슬라를 비롯해 미국 완성차 업체들이 불참을 통보했고, 닛산에 이어 스바루 역시 자동차 검사원 자격이 없는 사람을 서류 조작해 완성차 출고 전 검사를 시켰다는 사실이 도쿄 모터쇼 당일 언론에 보도되며 큰 소동이 있었음


Ø 앞서 10월 중순에 고베 제강이 10년 전부터 데이터 조작을 통해 고객이 요구하는 수준을 밑도는 제품을 출시한 것이 밝혀져 큰 충격을 준 바 있는데, 고베 제강의 6천여 개가 넘는 고객 중에는 다수의 자동차 관련 기업들도 포함돼 있어 일본차의 신뢰에 큰 금이 가게 만들었음


Ø 그러나 겉으로 드러난 악재와 달리 일본차들은 서유럽, 미국, 중국 등 3대 자동차 시장에서 성장을 이어가고 있는데, 서유럽에서 올해 일본차들의 점유율은 전년 대비 2.3% 포인트 늘어난 14.8%로 나타났고, 미국 시장 점유율 역시 역대 최고치인 40%대를 기록할 것으로 보임


Ø 중국에서도 2015년부터 3년 연속 두자릿 수 성장세를 기록하는 등, 일본 자동차 업계의 강세가 지속되고 있는데, 이번 도쿄 모터쇼에서는 이런 일본 자동차 업계의 저력을 다시 한번 확인할 수 있었다는 평가가 외신들로부터 흘러 나왔음


ž 특히 인공지능(AI) 기반의 음성 인터페이스와 자율운전 등 자동차 산업과 IT의 관계가 일본차들에서도 더욱 밀접해지고 있음을 보여주는 전시가 모터쇼의 핵심을 이루었음


<자료> Toyota


[그림 1] 도요타의 컨셉트 카 컨셉트-I


Ø 도요타 자동차는 음성 인식, 표정 분석, 자율운전 등 AI 기능을 구현하여 드라이버를 지원하는 컨셉트 카 ‘‘컨셉트-아이아이(Concept-i)를 선보이고, 부스에서 관람객이 AI에 의한 운전 지원 기능을 체험 할 수 있는 데모를 제공하였음


Ø 데모는 미국 샌프란시스코 근교를 드라이브 한다는 가정 하에, AI 에이전트와 음성 대화하면서 목적지로 향하는 것을 체험하는 것인데, 에이전트는 자동차를 타는 빈도나 휴일의 라이프스타일 등 관람객에게 사전 질문해 받은 응답을 토대로 드라이브의 목적지를 제안하였음


Ø 에이전트는 목적지에 대한 자세한 정보와 날씨, 소요 시간, 경로의 정체 여부 등을 운전자와 대화를 통해 안내하고, AI의 대답에 대한 운전자의 표정에서 감정을 읽어 운전자가 즐거운 표정을 하고 있다고 판단하면 보다 자세히 설명을 이어감


<자료> Toyota


[그림 2] 도요타의 운전자 감정 분석 기능


Ø 에이전트는 자율운전과 수동 운전을 여러 단계로 전환하고 전방에 위험이 감지하면 자동으로 정지하며, 운전 중 운전자의 표정을 카메라로 분석하여 목적지에 도착 후 가장 즐거워한 지점과 기장 놀랐던 지점을 알려주는 등의 기능을 안내하는 등의 기능도 체험하게 해주었음


Ø 도요타는 2020년경에 컨셉트-아이아이의 일부 기능을 도로에서 실증 실험을 할 계획임


Ø 도요타 렉서스는 인공지능을 장착한 완전 자율주행 컨셉트 카 LS+를 공개했는데, 하이웨이 팀메이트(Highway Teammate)라 이름을 붙인 AI가 운전자와 대화를 통해 주행 방식을 결정하는 모습을 시연하였음


Ø LS+ AI는 예를 들어, 앞차와 거리를 얼마나 유지할까요 또는 차선을 변경해 앞차를 추월할까요와 같은 질문을 운전자에게 던져 차량의 운행 방식을 이용자 뜻에 맡게 조절하였음


Ø 이 밖에 도요타는 수소 연료전지자동차(FCV)의 컨셉트 카인 파인 컴포트 라이드(Fine-Comfort Ride)를 최초로 공개했는데, 한번 주유로 약 1300km를 주행하는 프리우스처럼 파인 컴포트 라이드 역시 한번 충전으로 1000km 주행을 목표로 한다고 밝힘


ž 도요타가 컨셉트 카의 기술에 대한 자세한 내용을 밝히고 있지 않지만, 도요타의 비전을 뒷받침할 기술들은 미쯔비시 전기의 부스에서 전시되었음


Ø 미쯔비시 전기 역시 도요타와 마찬가지로 운전석에 장착된 카메라로 운전자의 감정을 식별하고 AI를 통해 음성 대화하는 드라이버 모니터링 시스템을 전시하였음


Ø 운전석에 앉은 운전자에 대한 기록이 있으면 AI는 그 이름을 불러 주고 운전자의 취향에 맞는 음악을 재생하는 등의 동작이 가능하며, 처음 탑승한 운전자라면 이름이 무엇인지 묻거나 차내의 기기 장치에 대한 설명을 자세히 하는 등 행동 방식을 바꾸게 됨


Ø 얼굴뿐만 아니라 손의 움직임도 인식하기 때문에, 가령 손을 들어 음악의 일시정지를 명령하는 등 버튼을 누르지 않고 다양한 작업을 할 수 있다고 하는데, 미쯔비시는 이 기술을 2018년에 실용화 할 방침이라고 함


Ø 미쯔비시는 또한 자사 내비게이션의 음성인식 기술도 시연했는데, 자체 개발한 환경음의 캔슬링 기능은 내비게이션이 음성 안내를 하고 있는 도중에 끝나기를 기다리지 않고 도쿄 타워 근처의 편의점'과 같이 명령하면 안내를 멈추고 다음 단계로 진행되는 것이 특징임


Ø 미쯔비시의 내비게이션은 2016년 모델부터 이 기능을 도입하고 있지만, 2018년식 모델부터는 클라우드 서버와 연계된 음성 인식 기술을 제공하여 인식할 수 있는 어휘 수나 인식 정확도를 높인다는 계획임


ž 미쯔비시 자동차는 아마존의 인공지능 스피커 아마존 에코(Echo)와 구글의 인공지능 스피커 구글 홈(Google Home)에서 자동차를 원격 제어하는 ​​데모를 전시하였음


Ø 에코와 구글홈에 각각 사용된 에이전트인 아마존 알렉사(Alexa)구글 어시스턴트(Assistant)를 통해 미쯔비시의 텔리매틱스 서비스인 미쯔비시 커넥트(MITSUBISHI CONNECT)에 접속하여 잠금 및 해제, 헤드램프의 점등과 소등, 차내 온도 조정, 엔진의 시동 등을 구현하였음


Ø 미쯔비시 자동차는 이번 데모에서는 AI 스피커를 사용했지만 실용화 단계에서는 차량의 스피커와 마이크를 사용하거나 운전자가 스마트폰의 AI 에이전트 앱에 음성 명령으로 원격 조작하는 방식을 우선 고려하고 있다며, 미국에서는 2018년부터 서비스를 제공할 계획이라 밝힘


ž 후지쯔 텐은 운행 기록 기기(드라이브 레코더, drive recorder)의 기능을 고도화하여 안전 운전과 교통 체증 해소를 위한 정보를 제공하기 위한 최신 기술을 선보였음


Ø 후지쯔 텐은 법인 소유 영업 차량 및 운송 차량 등을 위한 드라이브 레코더의 새로운 기능을 시연했는데, 카메라 영상이나 GPS 위치 정보 등을 바탕으로 데이터를 수집하여 빅데이터 분석을 통해 급브레이크 등 돌발사고 발생 지점의 특성을 분석하는 기능을 새롭게 개발하였음


Ø 관리자용 PC 화면에서는 지도 상의 핀 표시를 통해 돌발 사고 발생 지점을 확인할 수 있도록 했는데, 운전자의 성별, 나이, 면허 종류, 사고 발생 시간과 날씨 등을 기초로 가령 초보자 면허 20대 남성 운전자에게 저녁에 돌발사고가 발생하기 쉬운 장소를 확인할 수 있음


Ø 또한 후지쯔 텐은 드라이브 레코더가 촬영한 돌발 사고 발생 시의 영상을 CG 화하여 PC 화면에서 재생할 수 있는 기능을 제공할 예정이라 밝혔음



<자료> Fujitsu TEN


[그림 3] 후지쯔 텐의 드라이브 레코더 수집 데이터()와 관리자용 화면(아래)


Ø 이는 서비스 이용 계약을 맺은 어떤 기업의 차량에서 촬영한 영상을 그대로 다른 이용 계약 업체에 제공할 수는 없지만, CG화를 통해 다른 기업의 차량이 조우한 제공하여 참고할 수 있도록 하기 위한 것인데, 구체적 시기는 밝히지 않았지만 조만간 본격 제공할 것이라고 함


ž 도요타 역시 도쿄 근교를 운행하는 택시 500 대의 드라이브 레코더 영상과 차량 네트워크 (CAN)에서 획득한 실시간 주행 데이터를 지도로 표시해 주는 솔루션을 전시하였음


Ø 주행 속도를 포함한 주행 데이터를 1초 단위로 획득(서버 전송은 1분 단위)하는 동시에 드라이브 레코더의 영상을 분석하여 개별 택시가 주행 중인 차선을 식별하고 있는데, 이는 도로 단위뿐 아니라 차선 단위로 세분화하여 정체 정보를 실시간으로 생성, 전달하기 위한 것임


Ø 도요타는 2018년 봄을 목표로 일부 교차로에서 차선 단위의 정체 정보를 스마트폰 앱을 통해 제공하는 서비스 제공을 준비하고 있음


ž 이 밖에 최근 이슈가 되고 있는 개인 간 자동차 공유 및 수취자 부재 시 택배의 배달 문제와 관련된 전시도 있었음.


Ø 도요타는 자동차 키 대신 스마트폰 앱을 이용하여 잠금과 해제 및 엔진 시동 걸기를 가능하게 해주는 자동차 모듈 스마트 키 박스를 전시하였음


Ø 이 모듈은 가령 개인 간의 차량 공유 서비스에서 결제를 마친 이용 예정자에게 소정의 기간 동안에만 유효한 논리적 키를 발행하는 데 사용할 수 있음


Ø 또한 인터넷 쇼핑몰에서 구매한 상품이 배송되었으나 집에 없을 경우, 집 근처에 차량이 주차되어 있다면 트렁크 문만 열 수 있는 유효한 키를 택배업체 기사용으로 발행하는 등의 이용 방법을 상정하고 있는데, 미국에서는 이미 실증 실험을 시작했다고 함


ž 올해 도쿄 모터쇼는 그 동안 잘 부각되지 않았으나 일본 자동차 업계 역시 자율주행 등 자동차의 스마트 기기화 흐름에 뒤쳐지지 않고 있음을 확인시켜주는 자리였음


Ø 구글, 테슬라, 우버 등 그 동안 자동차의 IT화는 자율주행 및 AI 기술에 강점을 가진 미국의 IT 기업들이 주도해 왔으며, 세계 자동차 업계에 나름의 지분을 가지고 있는 일본 업체들의 IT 수용 노력은 상대적으로 덜 알려지거나 폄하되어 온 측면이 있음



Ø 그러나 고베 제강 비리나 무자격자 심사 사건 등 뒤숭숭한 분위기 속에 치러진 도쿄 모터쇼는 일본 자동차 업계가 그 동안의 평가와 달리 스마트 IT 시대에도 뒤쳐지지 않을 경쟁력을 갖추기 위해 상당한 노력을 해왔음을 보여 주며 앞으로도 선전할 가능성이 있음을 입증하였음


Ø 스마트 IT 시대를 맞이해 일본 자동차 업체들은 연비가 아닌 공간에 주력하는 하는 모습을 보였는데, 가령 도요타는 자동차를 넘어 사람의 이동을 돕는 기업으로라는 슬로건에 맞게 자율주행 시대에 중요해진 차량 내부 공간 설계에 초점을 두는 철학을 보여주었음


Ø 혼다 역시 과거와 미래가 공존하는 디자인이란 호평을 받은 전기차(EV) 어반(Urban)을 최초로 공개했는데, 미래지향적 디자인과 컴팩트한 차량 사이즈는 운전 욕구를 불러일으키며 운전을 기피하는 젊은 세대들에게 주행의 즐거움을 선사할 수 있겠다는 평가를 이끌어 냈음


<자료> Honda


[그림 4] 혼다의 EV 컨셉트 카 어반(Urban)


Ø 메이드 인 재팬 신화를 이룬 일본 자동차 업계가 IT 접목에도 상당한 성과를 이어가게 된다면, 테슬라 등 IT 기반의 파괴적 혁신 기업들과 경쟁을 통해 차세대 스마트 기기로서 자동차의 기능은 더욱 높은 수준을 향해 발전해 나갈 것으로 기대됨


댓글을 달아 주세요

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1798호(2017. 5. 31 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

인공지능 음성비서 서비스 탑재 기기 2021년 75억 대 이상 전망.pdf



ž 통신산업 시장조사기관 오범(Ovum)에 따르면 2021년 인공지능(AI) 음성인식 가상 비서 서비스를 이용할 수 있는 기기의 대수는 75억 대를 넘어설 전망


Ø 오범에 따르면 음성 인식 가상 비서 서비스는 현재 주로 스마트폰과 태블릿에서 이용되고 있는데, 2016년 말 현재 서비스 이용이 가능한 하드웨어 대수는 35억 대로 추산되며, 구글의 구글 나우(Google Now)와 애플의 시리(Siri)가 대부분을 차지하고 있음


Ø 그러나 2021년에는 현재 세계 인구를 넘어서는 75억 대에 이를 것으로 예상되며, 구글 어시스턴트(Google Assistant)가 점유율 23.3%로 선두를 차지할 것으로 예측됨


Ø 그 다음으로는 삼성전자의 빅스비(Bixby)14.5%, 시리가 13.1%, 아마존의 알렉사(Alexa)3.9%, 마이크로소프트의 코타나(Cortana)2.3% 점유율을 차지할 것으로 예측


Ø 기기 유형도 다양해져 향후에는 스마트폰과 태블릿 등 모바일 기기 외에도 스마트홈을 중심으로 새로운 기회가 열릴 것으로 예상되는데, 가상 비서와 음성 AI를 지원하는 스마트 홈 제품, TV, 웨어러블 기기의 수는 2021 년에 16 3천만 대에 달할 것으로 추정됨


<자료> Ovum


[그림 1] 2015-2021가상 비서와 음성 AI 지원 디바이스 추이 전망


Ø 특히 현재 인공지능 스피커 제품에 쏟아지고 있는 거대한 관심에도 불구하고, 비 모바일 기기 중에는 TV 기기(스마트 TV, 셋톱박스, 미디어 스트리머 등 포함) 57%로 가장 높은 점유율을 차지할 것으로 전망


ž 지역적 관점에서 보면, 음성 인식 가상 비서 서비스 이용은 북미 중심에서 벗어나 전 지구적 서비스로 확산될 것으로 예상됨


Ø 2016년 말 현재 아마존 알렉사와 구글의 구글 어시스턴트의 경우 북미 지역의 이용자 점유율이 95%에 이를 정도로 지역적 편중이 심한 상태이나, 2021 년에는 서비스가 전세계로 확산되고 아시아와 오세아니아 지역이 47.6%의 점유율을 차지할 것으로 전망됨


Ø 아시아 지역에서는 당연히 중국 시장의 성장이 두드러질 것인데, 2016년 기준 중국어를 지원하는 음성 비서 서비스 제공 하드웨어 기기 대수는 4,300만 대 수준이며, 바이두(Baidu)와 아이플라이테크(iFlytek) 등의 업체가 선도하고 있음


Ø 그러나 2021년에 중국어를 지원하는 음성 비서 서비스 제공 하드웨어 수는 12억 대에 달할 것으로 예상되며, 이는 애플의 시리와 삼성전자의 빅스비와 비슷한 규모가 될 것으로 보임

댓글을 달아 주세요

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1787호(2017. 3. 15 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

알렉사 기반 스킬 1만개 돌파.pdf



ž 아마존닷컴은 최근 인공지능(AI)을 이용한 클라우드 기반의 음성 비서 알렉사(Alexa)에서 사용할 수 있는 서비스가 1 만 개를 넘어 섰다고 발표


Ø 이용 가능한 서비스를 아마존은 스킬(Skill)이라 부르는데, 이는 스마트폰 등 모바일 기기에서 사용하고 있는 앱과 비슷한 개념으로, 예를 들어 스킬을 이용해 자신의 은행계좌 잔고 확인이나 피자 주문을 음성 명령으로 처리 할 수 있음


Ø 스킬과 앱의 차이점은 사용자가 말을 걸게 되는 기기가 스마트폰이 아니라 아마존이 제조해 판매하고 있는 스피커형 음성 지원 기기 에코(Echo), (Tap)과 미디어 전송 장치 파이어TV(Fire TV), 파이어 TV 스틱(Fire TV Stick) 등이라는 것


Ø 스킬은 아마존이 자체 개발 한 것과 아마존과 제휴하는 대기업이 개발한 것 등이 주로 제공되고 있는데, 아마존은 2015 6월에 알렉사의 구조를 공개하고 스킬 개발용 소프트웨어인 Alexa Skills Kit(ASK)의 제공을 시작해 써드파티의 적극 참여를 유도하고 있음


Ø 이렇게 개발된 스킬의 수는 1 년 만에 약 1천 개가 되었으며, 2016 9월에 3천 개를 넘어섰고, 그 후 5개월 만인 올해 3월 초에 다시 3 배 이상 늘어 1만 개를 돌파


Ø 아마존은 정확히 몇 명의 써드파티 개발자가 ASK를 이용해 스킬을 만들고 있는지 공개하지 않았지만, 언론은 수만 명의 개발자가 이용 중인 것으로 추측하고 있음


ž 아마존은 애플이 앱스토어 생태계를 통해 하드웨어 시장을 장악한 것처럼, 알렉사 스킬 생태계를 통해 스마트폰 이후의 시장 선점을 겨냥하고 있음



<자료> Alexa Skills Store


[그림 1] 아마존 알렉사 스킬 스토어


Ø CES 2017에서 알렉사의 경쟁 서비스인 구글 어시스턴트를 탑재한 제품은 거의 없었으나, 아마존은 박람회에 참여하지 않았음에도 불구하고, 700개 기업이 알렉사를 장착한 제품을 선보이며 CES 2017의 주인공으로 부상


Ø 아마존은 부스 하나 없이 CES를 점령했다는 평을 받았는데, 스마트폰부터 냉장고와 같은 가전, 자동차까지 모든 분야에 알렉사가 빠지지 않았음


Ø 아마존의 스킬에 해당하는 것을 구글은 액션(Action)이라 부르고 있는데, 현재 등록된 액션은은 100개를 넘지 못하고 있는 상태


Ø 반면 알렉사의 스킬은 거의 모든 분야에서 매일 등록되고 있으며, 모든 알렉사 스킬은 알렉사 스킬 스토어(Alexa Skills Store)를 통해 다운로드 받을 수 있음





댓글을 달아 주세요

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1786호(2017. 3. 8 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

아마존 음성인식 알렉사 기반 콜센터 사업 준비.pdf



◈ 아마존이 인공지능 음성 비서 기능인 알렉사(Alexa) 기반의 콜센터 지원 서비스를 준비 중이라고 복수의 미국 언론이 보도하였음


아마존 관계자로부터 나온 정보에 따르면, 아마존은 클라우드 서비스인 아마존 웹서비스(AWS)와 알렉사를 통합하여 고객 지원을 위한 소프트웨어를 판매할 계획이라고 함


새로운 서비스는 릴리(Lily)라는 개발 코드 명이 붙어 있으며 정식 발표는 3월 중순 경으로 예상되는데, 렉스(Lex)폴리(Polly) 등의 세부 서비스 상품으로 구성된다고 함


[동영상] 아마존의 Polly 프리뷰 발표


기업들은 이 서비스를 통해 음성이나 텍스트를 사용하는 대화 기능을 자신들의 애플리케이션에 추가하여 인간에 가까운 음성 채팅 봇을 구현할 수 있게 될 것인데, 콜센터 애플리케이션인 이러한 채팅 봇이 우선 적용될 수 있는 분야로 꼽히고 있음


일례로 알렉사는 이미 세일즈포스닷컴의 서비스와 통합되어 있는데, 고객의 통화 내역에 실시간으로 접근하고 이를 통해 고객은 콜센터에 다시 전화를 걸 경우 처음과 같은 메뉴 선택을 반복하지 않도록 대응할 수 있다고 함




댓글을 달아 주세요

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1782호(2017. 2. 8 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

AI 음성 클라우드 석권 조짐.pdf



[ 요 약 ]


아마존의 인공지능(AI) 스피커 에코(Echo)가 자연스러운 대화 기능으로 호평 받으며 폭발적인 판매 증가세를 보이고 있음. 아마존은 이러한 대화 기능을 AI 음성 클라우드 서비스 형태로 공개했고, 기업체들은 잇따라 아마존의 음성 AI 서비스인 알렉사(Alexa) 도입 계획을 발표하고 있음. 가전은 물론 로봇, 자동차 업체들의 러브 콜을 받고 있는 아마존은 서버 클라우드 사업의 뒤를 이을 새로운 시장으로 AI 기반 음성 클라우드 비즈니스 모델을 구축하고 이 시장을 석권하려 할 것으로 보임



[ 본 문 ] 


◈ 아마존 개발 팀은 인간의 본질적인 커뮤니케이션 수단이 이라는 점에 주목해, 대화를 이용한 주변 기기를 제어할 수 있는 인공지능을 개발하였음


아마존은 2014년 인공지능(AI) 스피커를 표방하며 선보인 에코(Echo)' 제품은 현재까지 누적 510만 대가 출시되며 히트상품 반열에 들어서고 있고, 지금은 에코 탭(Echo Tap, 휴대용 에코)에코 닷(Echo Dot, 소형 버전의 에코)이 제품 라인에 추가된 상태


<자료> Android Central


[그림 1] 아마존 에코 라인업


• 인공지능 스피커 제품의 이면에서는 AI 음성 기능인 알렉사(Alexa)가 구동되어 이용자와 대화가 가능하도록 주관하는데, 기기에 말을 걸면 음악을 재생하고 뉴스를 들려 주며, 스마트 홈의 허브로 기능할 수 있기 때문에 다른 가전도 말로 조작 할 수 있게 해 줌


아마존은 2012년에 알렉사의 개발을 시작하며 클라우드 기능을 모두 음성으로 조작하는 시스템을 목표로 했는데, 이 아이디어는 TV 프로그램 스타트렉(Star Trek) 중 우주선 내의 복잡한 기기들을 말로 조작하는 장면에서 힌트를 얻었다고 함


알렉사는 기기에 손대는 일 없이 음성 만으로도 정보에 접근하고 가전 제품을 조작 할 수 있는 환경을 제공하는데, 말은 인간의 본질적인 커뮤니케이션 수단이며 이러한 특징을 아마존 개발팀은 알렉사 개발에 적용한 것


◈ 아마존의 알렉사는 자사의 제품으로만 적용이 제한되어 있지 않으며, 플랫폼으로서 자리매김하여 그 위에 생태계가 형성되는 것을 지향하고 있음


<자료> Amazon


[그림 2] 아마존의 알렉사 플랫폼 전략


• 알렉사는 이미 외부에 공개되어 있고 많은 기업에 적용되어 음성 서비스를 제공하고 있으며, 써드파티 협력업체들은 이 기능을 이용해 음성으로 조작이 가능한 보이스 앱(voice app)의 개발에 나섬으로써 생태계에 동참하고 있음


아마존과 협력사들이 개발하고 있는 보이스 앱은 스킬(Skill)이라 부르는데 에코 출시 초기에는 10개 정도에 불과했던 스킬이 지금은 5,000개를 넘어섰다고 함


최근 인기 있는 스킬은 어메이징 워드 마스터 게임(Amazing Word Master Game)으로 에코와 끝말 잇기를 하는 게임 앱인데, 영어 공부에 도움을 받을 수 있는 것도 장점이지만 혼자서 할 일이 없을 때 에코를 놀이 상대로 삼을 수 있음을 잘 보여주는 사례임


비즈니스와 연계 된 스킬이 많아지고 있는 것도 특징인데, 가령 여행 사이트 익스피디아(Expedia)는 작년 말부터 알렉사를 이용한 음성 서비스를 제공하고 있으며, 비행기를 예약한 사람은 에코와 대화 방식으로 비행 세부내역을 확인할 수 있음


아마존 알렉사 플랫폼에서 주목해야 할 것은 에코에서만 작동하는 스킬 생태계 구축에 목표를 한정하는 것이 아니라, 음성 조작 기기를 개발하고 있는 업체라면 누구나 알렉사를 이용해 자신들의 제품에 음성 기능을 통합할 수 있게 하려는 개방형 정책을 편다는 점


◈ 알렉사 플랫폼이 우선 적용될 것으로 예상되는 분야는 에코와 동일한 카테고리인 가전과 가전 서비스인데, 위성 TV 서비스 디쉬(Dish) LG전자가 알렉사 도입 계획을 발표하였음


디쉬는 셋톱박스인 Hopper DVR을 에코 또는 에코 닷과 연결하여 TV를 말로 조작할 수 있는 기능을 제공할 계획임



<자료> DISH


[그림 3] 디쉬 위성TV 서비스와 에코 연계


• 가령 에코에 대해 알렉사 ESPN으로 가(Alexa, Go to ESPN)라고 지시하면 ESPN으로 채널을 변경하며, 프로그램을 검색하며 알렉사 레드삭스 중계 채널이 어디지?(Alexa, what channel is the Red Sox game on?)라고 물으면 에코가 해당 채널을 찾아 대답해 줌


이 서비스는 2017년 상반기부터 제공될 예정인데, 소비자 반응에 따라 앞으로 TV는 리모컨뿐만 아니라 음성 조작이 필수 인터페이스가 될 가능성이 있음


구글 역시 AI 대화 기능인 어시스턴트(Assistant)를 통해 TV를 음성으로 조작 할 수 있는 기능을 제공하고 있는데, 향후 TV 조작 음성 인터페이스의 패권을 놓고 에서 아마존의 알렉사와 구글의 어시스턴트가 치열한 경쟁을 벌일 것으로 예상



• 한편 LG전자는 스마트 냉장고인 'Smart InstaView Door-in-Door' 모델이 알렉사 보이스 서비스를 이용할 것이라 발표하였음


이 냉장고는 29인치 터치 스크린을 탑재하고 있으며, 이미 마이크로소프트의 음성 AI코타나(Cortana)를 인터페이스로 이용해 왔으나, 이를 알렉사로 변경한다고 밝힌 것


알렉사를 통해 이용자는 음성으로 레시피를 검색하고 쇼핑 목록을 만들 수 있으며 아마존닷컴에서 쇼핑까지 할 수 있기 때문에 냉장고를 스마트 홈의 허브로서 사용할 수 있음


LG전자의 스마트 냉장고는 가전의 진화 방향을 보여주고 있다는 평가이며, 향후 음성으로 조작 할 수 없는 가전 제품은 팔리지 않게 될 수 있음을 시사하고 있음


<자료> Engadget


[동영상알렉사 탑재 LG전자의 인공지능 음성 제어 냉장고


◈ 가전 다음으로 알렉사의 적용이 용이한 분야는 스마트폰인데, 화웨이(Huawei)는 자사의 최신 스마트폰 메이트(Mate) 9에 알렉사를 미리 설치하여 출시할 것이라 밝혔음


CES 2017에서 화웨이는 메이트 9에 보이스 앱이 탑재될 예정이며, 그 기저에는 알렉사 보이스 서비스가 사용될 것이라 발표하였음


이용자는 음성으로 메모를 작성하고, 날씨나 교통 체증 정보를 알려달라고 할 수 있으며 또한 메이트 9을 스마트홈의 허브로 삼아 가전 제품을 조작 할 수도 있다고 하는데, 이러한 보이스 앱은 올해 상반기부터 제공될 예정이라고 함


구글은 이미 안드로이드용 AI 대화 기능인 어시스턴트(Assistant)를 제공하고 있으며 이를 이용한 메신저도 선보이고 있기에, 올해 안드로이드 스마트폰 시장에서는 어시스턴트와 알렉사와 정면 대결이 볼만할 것으로 예상되고 있음


◈ 스마트폰 앱 개발업체들도 알렉사 스킬을 새로운 앱스토어 생태계로 보고 점차 관심을 기울이고 있는데, 스타벅스는 최근 알렉사를 활용한 앱 기능을 선보여 관심을 모으고 있음


<자료> YouTube


[동영상] 음성 AI를 도입한 스타벅스


• 평소 우리는IT 기업이다라고 외쳐온 스타벅스는 최근 AI를 활용한 음성 작동 챗봇을 개발해 사용하는 한편, 아마존 알렉사를 이용해 집 안에서 인근 스타벅스에 미리 주문을 넣을 수 있는 기능을 선보였음


이용자가 에코 스피커에 알렉사, 내 스타벅스를 주문해줘라고 말하면 인근 스타벅스 매장에 이용자가 평소 먹는 커피의 주문이 전달되는데, 이 기능을 사용하려면 스타벅스 모바일 주문·결제 계정을 만들어야 함


스타벅스의 새로운 기능들은 매장에서 모바일 앱으로 주문하려면 긴 줄을 서야 한다는 불만이 터져 나온 이후 개발됐다고 하는데, 모바일 앱을 통한 스타벅스 판매는 전체의 27%에 해당하기 때문에 스타벅스는 해결책을 제시해야 했고, 그 해답을 음성에서 찾은 것


◈ 커넥티드 카와 연계는 알렉사 플랫폼의 적용 분야가 광범위하게 확산될 가능성을 보여줄 수 있는데, 포드는 자동차 메이커로는 처음으로 알렉사 보이스 서비스의 도입을 결정하였음


이용자는 집 안에 있는 에코를 통해 포드 자동차를 조작 할 수 있는데, 알렉사, 마이포드 모바일에 시동을 걸라고 요청해줘(Alexa, ask MyFord Mobile to start my car)라고 에코에 지시하면 엔진 시동이 걸리게 됨


운전 중에는 센터페이사의 디스플레이 패널에서 알렉사를 이용할 수 있는데, 목적지 검색과 차고 문 개폐 등을 말로 지시 할 수 있음


이는 포드의 싱크(SYNC) 3 기술과 연계한 것으로 운전자의 스마트폰 앱에서 자동차로 접근하는 것과 같은 구성이며, 원격 시동 기능은 CES 2017에서 이미 선보였고 차량 내 알렉사 이용은 올 여름부터 가능할 것이라고 함


<자료> Ford Media

[동영상] 포드 싱크3와 연계되는 아마존 에코의 알렉사


• 자동차가 자율운전 차량으로 진화해 가고 있기 때문에, 운전자와 자동차의 인터페이스가 음성이 되는 것은 어찌 보면 당연한 흐름이기에 알렉사와 같은 음성 AI와 커넥티드 카의 결합 흐름은 앞으로 더욱 확대될 전망


◈ 자동차와 더불어 로봇 역시 음성 AI 플랫폼의 적용 분야로 높은 관심을 받고 있는데, 중국 선전에 본사를 둔 유비테크(UBTech)는 알렉사를 내장한 로봇 링크스(Lynx)를 발표하였음


링크스는 알렉사 보이스 서비스를 내장하고 있어 말로 조작이 가능한 로봇으로 음악 재생이나 메일 읽기 등을 음성으로 지시할 수 있음


이 로봇은 알렉사가 제공하는 기능 외에도 탑재하고 있는 카메라로 이용자를 식별해 개인별로 맞춤형 대응이 가능한 것이 특징이라고 하며, 또한 카메라를 보안 모니터로 사용하면 링크스를 이용해 외출 시에도 주택을 감시할 수 있다고 함


<자료> UBTech


[동영상] 알렉사 탑재 휴머노이드 로봇 링크스


• 그 동안 로봇 개발에서는 대화 기능이 걸림돌이 되어 왔지만, 알렉사 보이스 서비스를 이용할 수 있게 되면서 개발 기간을 단축할 수 있게 되었고, 손쉽게 로봇을 개발할 수 있게 됨에 따라 로봇시장의 진입 장벽이 크게 낮아질 것이란 전망도 나오고 있음


링크스의 가격은 800 달러에서 1,000 달러로 2017년 후반에 정식 출시될 예정인데, 링크스의 성공 여하에 따라 알렉사가 로봇의 표준 인터페이스로 자리 잡을 가능성도 있음


◈ 이처럼 다양한 분야의 제조업체들이 잇따라 알렉사 플랫폼에 호응하는 이유에 대해 전문가들은 AI를 활용한 고급 대화 기능을 경쟁사 보다 월등히 구현해주기 때문이라 평가하고 있음


알렉사를 탑재한 기기들은 알렉사라는 호명을 감지하면 이후 이어지는 음성 스트림을 클라우드로 전송하며, 일련의 대화 처리는 클라우드에서 이루어짐


구체적으로는 음성 인식, 자연어 처리, 문자-음성 합성(Text-to-Speech Synthesis)의 처리가 실행되며, 이 과정에서 AI가 사용되는데 아마존은 하나의 AI가 아니라 각 모듈 별로 고급 AI가 구현되어 음성 서비스를 지원한다고 함


알렉사가 고급 대화 기능을 제공 할 수 있는 이유로는 AI 알고리즘을 최적화하는 교육 데이터의 강점이 꼽히는데, 여기서 교육 데이터는 말(사운드)과 그것을 표시하는 문자(텍스트)의 조합을 의미함


AI 알고리즘 개발에 사용하는 음성 교육 데이터로는 주로 콜 센터 오퍼레이터들의 대화가 사용되나, 가정에서 주로 사용하는 대화(가령 차고 문 닫아 )를 기반으로 한 교육 데이터는 거의 없다고 함


아마존은 2014 11월에 에코 출시 이후 이용자의 피드백 등을 사용하여 교육 데이터를 정비해 왔으며, 이런 데이터 축적이 고급 대화 기능 구현에 있어 타의 추종을 불허하는 이유가 되고 있다는 분석


◈ 전문가들은 아마존이 이러한 알렉사의 경쟁력을 바탕으로 아마존 웹서비스(AWS)의 성공을 뒤이을 새로운 비즈니스로 AI 음성 클라우드 서비스 시장을 개척해 나갈 것이라 예상


AWS가 여러 난관을 뚫고 성장하며 지금은 대기업들도 사용하는 서비스로 성장한 것처럼 아마존은 AI 음성 클라우드 서비스의 가능성에 확신을 가지고 있는 것으로 보임


우선은 AI 음성 클라우드 서비스가 이슈화되는 것이 중요하기 때문에, 아마존은 구글 어시스턴트 같은 경쟁 서비스의 존재를 반기는 입장이며 적대적 경쟁관계로 보지 않고 있음


이는 홈킷(HomeKit)을 통해 폐쇄적인 생태계를 구축하려 하는 애플의 정책과 대별되는 아마존의 플랫폼 정책이라 할 수 있음


아마존은 이미 스마트홈, 가전, 자동차, 로봇 등 여러 분야에서 AI 음성 서비스 시장을 선도하고 있기 때문에, 일단 시장이 형성되고 나면 석권할 수 있다는 기대와 자신감이 있는 것으로 보이며, 전문가들도 실제 아마존의 기술이 표준이 될 가능성도 내다보고 있음


◈ 아마존이 AI 음성 클라우드 시장의 초기 주도권을 선점함에 따라, 가전, 자동차, 로봇 제조업체들은 알렉사를 이용할 것인지, 자체 개발할 것인지 선택의 기로에 서게 될 전망


다양한 기기 제조업체들은 알렉사 보이스 서비스를 통해, AI 음성 기능을 독자적으로 개발하는 수고를 줄이면서도 자신들의 제품에 대화 기능을 통합할 수 있게 되었음.


자체 기술 개발에 대한 미련과 유혹은 항상 존재하지만, 알렉사를 기본 기능으로 채택하고자 결정하는 기업들이 늘어난다면, AWS가 그랬던 것처럼 알렉사 보이스 서비스가 표준 AI 음성 클라우드 서비스로 자리매김할 가능성이 있음


<자료> Lenovo


[그림4] 알렉사 탑재 레노보의 AI 스피커


• 기업들은 알렉사는 기본기능으로 두고 다른 요인에서 차별성을 찾는 전략을 구사할 수 있는데, 레노보의 AI 스피커 스마트 어시스턴트(Smart Assistant)는 이런 흐름을 잘 보여줌


스마트 어시스턴트는 에코와 모양뿐 아니라 기능적으로도 매우 유사한 제품이나, 차별점은 프리미엄 스피커인 하만 카돈(Harman Kardon)을 탑재하고 있다는 것


올해 5월부터 판매될 스마트 어시스턴트는 에코와 동일 기능, 더 나은 스피커임에도 가격은 에코와 동일한 180 달러로 책정하여 경쟁력을 확보할 방침인 것으로 알려짐


레노보와 같은 전략을 취할 것인지, 독자 AI 음성 기술을 개발을 것인지 기업들은 선택해야 하는데, 이는 마치 클라우드 서비스를 이용할 것인지 아니면 기업 내부에 자체 컴퓨팅 환경을 구축할 것인지 선택하는 문제와 유사함


확실한 것은 알렉사로 인해 점점 더 많은 기업들이 자신들의 제품과 서비스에 AI 음성 기능의 접목을 고려하지 않을 수 없게 되었다는 것이며, 고민하는 기업이 늘어날수록 AI 음성 클라우드 서비스 시장도 급속도로 발전하게 될 전망

댓글을 달아 주세요

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1779호(2017. 1. 18 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

화웨이, R&D 투자 세계 1위 기업이 목표.pdf



◈ 중국 화웨이(Huawei)는 이달 초 미국 라스베이거스에서 열린 'CES 2017' 기조 연설에서 B2C 사업부문에 대한 자신들의 노력과 미국 시장 공략을 위한 전략을 발표


화웨이의 소비자 비즈니스 그룹 리차드 유 CEO는 자신들의 전세계 인구 3분의 1일 연결하고 있다며, 단지 화웨이가 통신 서비스의 백오피스를 주로 지원하고 있기 때문에 많은 사람들은 화웨이임을 모른 채 화웨이를 이용해 오고 있다고 설명


화웨이의 스마트폰 출하대수는 2014 7,500만 대, 2015 1 800만 대에 이어 2016년에 1 3,900만 대를 기록했다고 하는데, 수치로만 보면 화웨이는 소비자 사업부문에 참여한 지 얼마 안되었음에도 세계 3대 스마트폰 브랜드로 올라선 것임



<자료> ITPro

[그림 1] 글로벌 스마트폰 No.3 화웨이


브랜드도 점차 성장하고 있는데, 5년 전만 해도 화웨이를 아는 사람은 거의 없었지만 화웨이가 독자 브랜드를 사용하기 시작하면서, 2016BRANDZ의 조사에서는 세계 톱 100 브랜드 중 50, Interbrand의 조사에서는 72위를 차지하였음


리차드 유 CEO는 이런 성과를 바탕으로 자신들의 스마트폰 시장 점유율이 계속 증가하고 있다며, 향후 2년 내에 톱2 자리를 노리겠다고 선언


◈ 이를 위해 화웨이는 R&D에 지속적으로 투자할 방침이며, 향후 2~3년 내에 세계 제1 R&D 투자 기업이 될 것을 목표로 한다고 천명




• 발표에 따르면 화웨이는 지난 10년간 R&D 부문에 총 380억 달러를 투자하였으며, 2016년에는 애플이나 시스코 보다 많은 92억 달러를 투자했는데 이는 전세계 기업들 중 R&D 투자 금액 기준으로 9위에 해당


화웨이는 HUAWEI P9 모델의 카메라를 공동 개발한 라이카와 함께 라이카 창업자의 이름을 딴 Max Berek Innovation Lab을 독일에 설립했다고 소개


앞으로도 R&D 투자는 대폭 늘려나갈 방침인데, 구체적인 실행계획으로 미국에 UX 디자인 센터 설치, 프랑스에 미학 센터, 독일에 5G 연구소, 영국 케임브리지 대학과 사진 기술 공동 연구, 맨체스터 대학과 배터리 기술 공동 연구 진행 등을 꼽았음



<자료> MStarsNEws


[그림 2] 전세계 주요 도시의 화웨이 R&D 센터들


◈ 이러한 연구개발 끝에 화웨이가 마주하게 된 것은 지능형 세계였다고 하며, 화웨이는 스마트폰에 인공지능(AI)을 더한 지능형 폰(Intelligent Phone)의 실현을 향후 목표로 제시


화웨이는 향후 5~10년 내에 지능형 세계가 도래할 것이며, 이 세계에서는 모든 것이 인터넷에 접속되는 센서를 탑재하고 이 센서 네트워크를 AI가 지원함으로써 디지털과 물리적 세계가 융합하게 된다고 설명


지금까지는 뇌파와 시각, 청각, 촉각 등 물리적인 세계는 디지털과 다른 것이었지만, AI와 센서가 있으면 두 세계를 연결할 수 있다는 비전을 제시


<자료> International Business Times


[그림 3화웨이의 인공지능 기반 디바이스


◈ 기조 연설을 통해 화웨이는 HUAWEI Mate 9 모델을 미국 시장에 출시한다고 발표했는데, 화웨이가 플래그쉽 스마트폰을 미국에서 출시하는 것은 이번이 처음이라고 함


Mate 9은 메모리가 4GB, 스토리지 64GB를 제공하며, 자체 급속충전 기술인 SuperCharge를 지원하는데, 30분 만에 하루 사용할 정도의 충전이 가능해 충전 속도로 아이폰7에 비해 4배 가량 빠르다고 주장


듀얼 SIM을 지원해, 주파수 대역이 다른 2개의 통신사를 이용하거나 해외 여행시 현지 SIM 카드를 넣어 저렴하게 통신 할 수 있는 것도 장점으로 설명


판매가 시작된 Mate 9599.99 달러로 아이폰 7 32GB 모델보다 50달러 가량 낮음


        [화웨이 Mate 9 소개 동영상 보기]



◈ 라인업 중, Mate 9 Porsche 모델과 Mate 9 Pro 모델은 구글의 가상현실(VR) 기술인 데이드림(Daydream)을 지원한다고 하는데, 이에 대해서는 구글 임원이 직접 등단하여 설명


구글측 설명에 따르면, 데이드림 기술은 하드웨어와 긴밀한 협력이 필수적인데, 화웨이의 시스템온칩(SoC) Kirin 칩셋에 데이드림을 최적화함으로써, 콘텐츠와 애플리케이션, 게임에 진정으로 몰입감 있게 VR로 체험 할 수 있게 되었다고 함


• 구글은 이미 데이드림용 헤드셋으로 데이드림 뷰(Daydream View)를 판매하고 있지만, Mate 9에 최적화된 새로운 모델도 발표하였음

또한 구글의 증강현실(AR) 플랫폼인 탱고(Tango) 지원 디바이스를 화웨이와 개발 중이라고 밝히며, 조만간 발표될 수 있을 것임을 시사


◈ 화웨이의 Mate 9은 이번 CES 2017에서 가장 화제를 모은 아마존의 인공지능 음성제어 기술 알렉사(Alexa)도 지원하는데, 이에 대해서는 아마존 임원이 직접 등단하여 설명


화웨이의 Mate 9 모델은 알렉사를 지원하는 최초의 스마트폰이 되는 것인데, 이를 위해 화웨이는 2017 1분기 중에 업데이트를 실시할 계획이라고 함


아마존 알렉사 사업부문 부사장은 알렉사를 통해 클라우드 서비스에 음성으로 접근할 수 있게 된다며, 화웨이와 긴밀한 연계를 통해 Mate 9에 탑재가 가능했다고 설명


아마존은 알렉사의 음성 명령으로 호출 할 수 있는 기능을 스킬(skills)이라 부르고 있는데, 이미 7,000개가 넘는 스킬이 개발되어 등록되었다고 함


시연을 통해 Mate 9에 음성으로 말을 걸어 쇼핑을 즐기거나 우버에 배차를 요청하는 것 것 보여주었는데, 이번 CES 2017에 다수의 알렉사 지원 기기가 선보였지만, Mate 9은 스마트폰에서 알렉사를 사용하는 차별화된 경험을 제공하였음

댓글을 달아 주세요

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1773호(2016. 11. 23 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

기업의 디지털 마케팅 툴로 부상하는 채팅봇.pdf



[ 요 약 ]


2000년대 초반 이후 인공지능 채팅 로봇 개발 시도는 간헐적으로 전개되어 왔으나 눈에 띄는 흐름을 만들어 내지 못하다가, 올해 4월 페이스북 메신저의 채팅봇 지원 발표 이후 관련 논의가 급물살을 타고 있음. 채팅봇은 새로운 전자상거래 플랫폼이 될 것이라는 전망이 나올 만큼 무궁한 잠재력을 지니고 있으므로, 기업의 마케팅 담당자는 채팅봇 기술을 제대로 활용하기 위해 기술에 대해 정확히 이해하고 기업 IT 부서와 긴밀하게 공동 대응해 나갈 필요가 있음



[ 본 문 ]


2016년 초반까지만 해도 채팅봇은 IT 업계에서 거의 주목받지 못했으나, 4월에 개최된 페이스북 개발자 컨퍼런스 이후 관련 논의가 급물살을 타고 있음


메신저 상에서 사람들과 대화를 나눌 수 있는 인공지능 개발은 오래 전부터 시작되었으며, 2002년 마이크로소프트(MS) MSN 메신저 상에 네트워크 에이전트를 선보인 것이 다수의 소비자를 대상으로 한 첫번째 채팅봇 구현 시도였음


그러나 MSN의 높은 인기에도 불구 에이전트 서비스는 유의미한 반향을 불러 일으키는 데 실패하였으며, 이후 채팅봇은 성인사이트 등에서 일부 고객지원 기능의 대체제로 활용되기는 했으나, 대중적인 서비스로 자리잡지는 못했음


올해 초반까지만 하더라도 상황은 비슷했으나, 최근 급속한 기술발전 양상을 보인 인공지능이 이슈로 급부상하기 시작했고, 4월에 열린 페이스북 개발자 컨퍼런스 F8에서 메신저 플랫폼과 채팅봇에 대한 발표가 이루어지면서 상황이 변하기 시작


F8 이후 MS, 구글, 아마존 등도 인공지능 기반의 대화형 서비스를 발표했고, 메신저 상의 채팅봇은 차세대 전자상거래 플랫폼으로 거론되며, 채팅봇은 일순 IT 업계의 다음 물결(next wave)로 자리매김 되고 있음


Kik(), LINE(라인), Telegram(텔리그램) 등 메시징 플랫폼에서도 자신들이 개발한 채팅봇의 실험을 진행하고 있으며, 지난 9월 말 텍사스 오스틴에서는 채팅봇 관련 컨퍼런스인 'Talkabot(토커봇)'이 개최되기도 하였음


◈ 메신저 플랫폼에서 채팅봇이 차세대 상거래를 주도할 것이라는 전망이 나오는 만큼 기업의 마케팅 담당자들은 채팅 로봇의 현재와 미래에 대해 정확히 이해할 필요가 있음


구글 어시스턴트나 아마존 에코에서 확인이 되듯, 인공지능이 사용자와 대화하며 요구사항을 수행하는 기술은 이미 궤도에 들어서고 있음


• 채팅 로봇이 차세대 전자상거래 플랫폼이 된다는 의미는 사용자의 취향을 학습한 가상 비서와 각 기업의 상품과 서비스를 판매할 수 있는 인공지능 채팅봇들간의 상호작용을 통해 상거래가 이루어지는 시대가 도래한다는 것


<자료> IITP.


[그림 1] 메신저 플랫폼과 채팅봇


기업 입장에서는 소비자의 요구사항을 잘 이해하고, 올바르게 대응하여 기업의 상품과 서비스를 판매할 수 있는 인공지능 채팅봇의 운영이 중요해지며, 디지털 마케팅과 영업의 최전선에 채팅봇이 자리잡게 됨을 의미


검색엔진, 유튜브, SNS 등 기술 트렌드에 따라 기업의 디지털 마케팅 도구도 변화하고 있는데, 다음 번 디지털 마케팅의 핵심 트렌드는 채팅봇이 될 것이란 전망인 것임


따라서 기업의 마케팅 담당자는 채팅봇 기술의 현재와 미래, 실제로 마케팅 효과가 있을 지에 대한 판단, 채팅봇을 운영하기 위해 필요한 자원과 전사적 협력 체계, 운영 시 유의사항은 무엇인지에 대해 정확히 이해할 필요가 있음


◈ 기업의 마케팅 담당자들이 채팅봇에 대해 알아야 할 항목은 크게 7가지인데, 우선 채팅봇이 무엇인지 정확히 이해해는 것으로부터 출발해야 함


채팅봇 전문 사이트 챗봇 매거진(ChatbotsMagazine.co)은 채팅봇에 대해, 인간이 채팅 인터페이스를 통해 접촉하는 서비스로 규칙에 따라 작동되며, 때로 인공지능(AI)이 사용되는 경우도 있음이라 정의하고 있음


챗봇 매거진에 따르면 현존하는 채팅봇은 크게 두 가지로 나누어 볼 수 있는데, 첫번째는 기업들이 사업의 목적에 맞게 제공하는 채팅 로봇으로 일반적인 메시징 앱에서 사용할 수 있음


예를 들어 페이스북 메신저 앱에서 사용할 수 있는 CNN의 뉴스 채팅봇이나, 꽃 배달업체 1-800-Flowers의 선물용 꽃꽂이 상품 선택과 배송을 지원하는 채팅봇이 대표적


두 번째 유형은 챗봇 플랫폼으로 애플의 시리(Siri), 구글의 구글 어시스턴트(Google Assistant), 아마존의 알렉사(Alexa), MS의 코타나(Cortana) 같은 가상 비서가 해당함


채팅 로봇 플랫폼은 특정 기업과 소비자의 접촉을 지원한다기 보다 다종다양한 정보 및 다른 수요와 관련해 이용자들을 지원하는 기능을 함


◈ 마케팅 담당자들이 알아야 할 두 번째 항목은 활용 범위로, 현 단계에서 채팅봇은 전자상거래, 고객 서비스, 여행, 불면증 완화 등에 이용되고 있음


• 웹사이트 봇리스트(Botlist)는 채팅봇을 플랫폼과 카테고리별로 소개하고 있는데, 메시징 앱의 채팅봇은 기본적인 커뮤니케이션 기능, 전자상거래 기능, 여행계획 수립 등을 제공함


<자료> botlist.


[그림 2] 채팅봇 검색 사이트 봇리스트


현재 채팅봇은 특히 기업들이 상거래를 촉진할 목적으로 널리 사용하고 있으며, 젊은층을 주요 타깃으로 해 이용자의 구매 욕구를 불러일으키고, 구매할 상품의 수를 늘리는데 초점을 두고 있음


채팅봇은 대고객 서비스 부서나 영업 담당자의 업무 부담 경감 효과를 가져올 수도 있지만, 더 큰 가능성을 내포하고 있는 것은 개인화(personalize)와 참여(engagement)


가령 아마존 인공지능 스피커 에코(Echo)의 경우 대화형 상거래라는 새로운 물결을 만들어 냈으며, 이용자는 자신이 필요로 하는 것을 요청하는 것 만으로 간단히 주문과 배송이 이루어질 수 있게 하였음


침대 매트리스 생산 및 판매 사업을 하는 스타트업 캐스퍼(Casper)가 불면증 환자들을 위해 제공하는 채팅봇인 인섬노봇-3000(Insomnobot-3000)도 인구에 회자되고 있는데, 이 채팅봇은 밤 11시부터 새벽 5시 사이에만 이용할 수 있음


캐스퍼의 채팅봇은 수면 혹은 수면 부족과 관련한 모든 것을 가지고 있기 때문에, 캐스퍼의 브랜드를 강화해 주며 채팅봇 이용 마케팅의 성공사례로 꼽히고 있음


캐스퍼는 이용자들을 속여 실제 인간과 대화하고 있다고 믿게 만들려는 시도를 하고 있지 않으며, 이용자들이 인기 프로그램의 재방송, 한밤중의 간식, 자주 거론되는 화제에 대해 채팅봇과 즐거운 대화를 갖도록 하는 데 초점을 두고 있음


[1] 인기를 모으고 있는 주요 채팅봇 리스트

채팅봇

주요 기능

우버

배차 의뢰

맥켈란(Macallan)/앱솔루트

신규 고객에게 적합한 위스키를 찾도록 안내해 주는 개인화 서비스

버버리

2016 9 London Fashion Week 기간 중에 자사 패션 쇼케이스

타코 벨(Taco Bell) / 도미노

음식 주문

하이 판초(Hi Poncho)

고양이 캐릭터가 일기 예보를 전달하는 메신저 앱의 인기 채팅봇

헬로보우트(HelloVote)

투표 이벤트 등록 지원

아이슬란드 에어

항공 일정 검색 및 예약

조지 타케이(George Takei)

스타트렉 TV 시리즈에서 Hikaru Sulu 역을 맡은 타케이의 개인 채팅봇.

<자료> CIO, 2016. 10, IITP 재정리


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 세 번째 항목은, 채팅봇은 갑자기 나온 기술이 아니라 수년 동안 이미 이용해 오고 있던 기술을 업그레이드한 것이라는 점


예를 들어, 항공사, 은행, 보험회사 등에 전화를 걸면 자동응답시스템이 먼저 전화를 받을 경우가 많은데 이러한 자동응답시스템 역시 로봇의 일종임


이런 유형의 시스템들은 소비자가 어떤 선택을 하도록 촉진함으로써, 이용자가 원하는 정보를 쉽게 제공하는 것을 목적으로 함


자동응답을 통한 접촉은 보통 고객경험의 향상에 연결되지는 않는 단점이 있는데, 왜냐하면 이용자가 여러 단계를 거쳐 특정 창구에 도달하더라도 결국은 보류 상태에서 기다리게 되거나 전화가 자동으로 끊어지는 일이 빈번하기 때문


이에 비해 메시징 앱과 채팅봇을 결합한 접촉은 시각적이며 반응이 빠른데, 이용자가 던진 질문에 대답이 되는 정보를 동영상이나 사진 등의 형태로 피드백 할 수 있음


이용자는 시간을 낭비하지 않아도 되고 전화가 끊길 걱정도 할 필요가 없어 채팅봇을 사용하는 편이 이용자의 참여 만족도를 훨씬 더 높여줄 잠재력이 있음


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 네 번째 항목은, 메시징 앱 전성시대는 채팅봇의 급성장도 추동할 것이므로, 채팅봇은 피할 수 없는 환경이 될 것이라는 점


모바일 앱 중에서 현재 메시징 앱이 특히 많이 사용되고 있기 때문에, 메시징 앱에서 사용할 수 있는 채팅 로봇 역시 인지도가 향상되고 있음


메시징 앱의 월간 액티브 이용자 수는 SNS 앱보다 많은데, 상위 4개 메시징 앱의 액티브 이용자 수는 월간 30억 명으로, SNS 앱의 이용자 수 5억 명에 비해 압도적


메시징 앱의 사용이 증가하고 있는 반면, 모바일 앱 전반적으로 보면 앱의 붐은 사라지고 있다고 말할 수 있는 현상들이 벌어지고 있는데, 가령 2016 5월말 기준 모바일 앱 상위 15개의 다운로드 수는 전년 동월 대비 평균 20% 감소하였음


• 시장조사기관 컴스코어(comScore)에 따르면 미국 스마트폰 사용자의 절반은 20162분기에 다운로드 한 앱의 수가 하나도 없었음



<자료>comScore.


[그림 3] 2016 2분기 미국 앱 다운로드 수


뉴욕 타임즈는 대기업들은 고객 서비스 용이성을 위해 자체 개발한 전용 앱을 제공하고 있으나, 이는 사람들을 피곤하게 하는 일이며 사용자들은 점차 개별적으로 앱을 다운로드 하는데 싫증 내고 있다고 지적하고 있음


이런 분석 역시 점차 앱의 시대가 저물어 가고, 채팅봇을 이용한 상거래 시대가 올 것이라는 전망과 궤를 같이 하는 것이며, 마케팅 담당자들이 놓치지 말아야 할 지점임


◈ 그러나 채팅봇은 아직까지는 초보적이고 시험적인 단계에 있다는 점도 간과하지 말아야 하며, 이 점이 마케팅 담당자가 채팅봇에 대해 알아야 할 다섯 번째 항목임


채팅봇이 중요한 고객 참여 도구가 될 수 있기는 하지만 현재 메시징 앱의 채팅봇은 아직 기술적으로 계발되지 않은 상태라 할 수 없음


애플이 앱스토어를 처음 개설한 2008년 무렵에 등장했던 초기 아이폰 앱들과 유사한 단계로 볼 수 있는데, 당시 방귀 소리를 내는 앱이 최고 인기 앱이었던 점을 상기하면, 현재 채팅봇 역시 소위 방귀 앱의 단계에 있는 것으로 볼 수 있음


채팅의 기초를 이루는 자연언어 처리와 기계학습 등의 기술은 아직 진화의 도중에 있으며, 미리 입력된 대화 레퍼토리에 의존하지 않고 인간과 로봇이 매끈하게 대화할 수 있는 경지까지 도달하려면 좀 더 시간이 필요할 것임


MS의 채팅봇 테이(Tay)가 사용자들이 의도적으로 잘못 학습시킨 것에 영향을 받아 인종차별적 발언을 쏟아 내며 서비스 시작 16시간 만에 MS가 사과문을 발표하고 서비스를 중단시킨 사건은 현단계 채팅봇의 수준을 잘 보여주는 사건이라 할 수 있음


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 여섯 번째 항목은 채팅봇에 상거래와 마케팅의 미래가 있기는 하지만, 채팅봇이 인간을 대체하는 것은 아니라는 점


채팅봇이 웹, 메일, 웹사이트, 또는 인간을 아예 대체하는 것은 아니며, 복잡하지 않은 쇼핑을 지원하고, 이용자가 원하는 정보를 신속하게 제공하는 등 특정 용도에 적합한 형태로 폭넓게 대규모로 도입되어갈 것으로 보임


그러한 용도로 사용한다고 하며, 채팅봇은 실제로 다른 방법으로 고객과 접촉하는 것보다 더 우수한 서비스 제공 수단이 될 수 있음


현재 실행 중인 채팅봇들은 약간은 눈속임 같은 것이며, 채팅봇의 화제성에 편승할 목적으로 급작스럽게 만들어 진 것이 대부분일 지도 모르나, 메시징 앱을 통해 기업과 11로 커뮤니케이션 한다는 개념만큼은 확실히 정착되어 가고 있음


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 마지막 항목은 채팅봇을 개발할 때 마케팅 담당자와 IT 부서와 처음부터 긴밀하게 협력하지 않으면 안 된다는 점


IT 부서와 협력해야 하는 가장 큰 이유는 최대한 보안성을 보장하기 위해 채팅봇의 통신을 암호화하고 암호화 된 채널에만 채팅봇을 도입하는 것이 필요하기 때문


기업 시스템 내에서만 작동하는 사내 봇이라면 독자적인 암호화 채널에 설치할 수도 있지만 메시징 앱과 같은 일반용 채널에 채팅봇을 도입하고 싶다면 채팅봇의 보안은 해당 플랫폼의 보안 기능에 완전히 좌우될 수밖에 없음


채팅봇에 숨어있는 보안 문제는 또 있는데, 채팅봇이 인간을 모방하는 능력이 높아지게 되면, 해커가 피싱 등 소셜 엔지니어링 기법으로 해킹을 시도할 때 채팅봇이 악용될 위험이 다분하다는 점


예를 들어, 고객 및 공급업체를 본뜬 채팅봇을 이용해 표적 회사의 직원 사이에 메시징 앱을 통한 대화를 시작하고, 의사 소통 관계가 확립된 시점에서 채팅봇이 직원을 부추겨 악성 링크를 클릭하거나 기밀 정보를 넘기게 할 수도 있음


◈ 채팅봇의 운영을 위해서는 상당한 자원의 소요가 요구되므로, 채팅봇의 성공적 운영을 위해서는 사실 IT 부서와의 협력뿐만 아니라 전사적 차원의 협력과 지원이 필요함


채팅봇 운영에는 상당한 지원이 필요한데, 대부부의 IT 부서는 채팅봇 개발자가 테스트 및 지원을 담당하지만 가동 후 채팅봇 지원을 위한 자원까지 있는 것은 아님


채팅봇은 일반적으로 고객 라이프 사이클 전반에 걸쳐 관련 활동을 하기 때문에 지원에 필요한 자원의 규모를 우습게 보면 안되며, 부서별로 업무가 단절된 기업에서는 사내 예산 배분과 귀속 문제에 직면하게 될 지도 모름


채팅봇 전문가들은 가치 있는 채팅봇을 개발하는데 있어 최대의 난관은 기반이 되는 기술 요소를 기업의 전사 시스템과 통합하는 일이라고 지적함


채팅봇의 실용성을 떠받치는 기둥이 되는 자연언어 처리와 예측 분석 기술은 대부분의 IT 부서에서 보유하고 있는 핵심역량이 아니므로, 통합 업무가 결코 간단치 않음


기업의 채팅봇은 CRM, 헬프 데스크, 주문처리 시스템 등 기업의 데이터 시스템과 직접 연계되어야 하며, IT 부서는 기술 아키텍처를 포괄적으로 파악하여 기업의 커뮤니케이션 아키텍처 전체가 채팅봇과 원활하게 연계할 수 있도록 해야 함


◈ 새로운 마케팅 도구의 활용 능력이 기업의 성과에 직결되고 있으므로, 디지털 마케터들은 자신들에 적합한 채팅봇 활용 전략의 수립과 실행에 역량을 모아나가야 할 전망


기업의 비즈니스 활동이 디지털 환경으로 옮아 감에 따라, 새로운 기술의 등장에 따라 부상하는 디지털 마케팅 기술들은 기업 성과에 상당한 영향을 미치고 있음


채팅봇은 아직 개발 중에 있는 기술이나 이미 시도되고 있는 기술이기도 하며, 검색엔진 마케팅과 SNS 마케팅이 그랬던 것처럼 어느 순간 갑자기 기업의 핵심적인 마케팅 채널로 급부상하여 기업의 성패에 영향을 미치게 될 가능성도 매우 높음


기업의 마케팅 역량과 자산을 어떤 방식으로 채팅봇에 학습시키고 사용자와 소통하게 할 것인지, 이를 위해 기업의 IT 부서 나아가 전사적 차원에서 어떤 협력관계를 구축할 것인지에 대한 전략 수립이 디지털 마케팅의 핵심 과제로 부상하고 있음

댓글을 달아 주세요

※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1770호(2016. 11. 02 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

인간의 감정을 이해하는 인공지능 -목소리 톤에서 감정을 읽는다.pdf



[ 요 약 ]


기계가 인간의 감정을 이해하고 인간미 있는 동작을 취하고기계가 인간과 대화를 하며 그 자리의 느낌을 이해할 수 있다면인간이 기계를 바라보고 인식하는 태도는 아마 지금까지와는 사뭇 달라질 것임최근 인간의 감정을 이해하는 인공지능(AI)들이 등장하기 시작하며전통적인 기계와 인간의 관계가 바뀌려 하고 있으며인간과 AI의 공존의 전제조건이 될 사람과 기계 사이의 정서 관계가 생성되기 시작할 날도 그리 멀지 않을 것으로 예상되고 있음



[ 본 문 ]


◈ 이스라엘에 본사를 둔 벤처 기업 비욘드 버벌(Beyond Verbal)은 회사 명에서 알 수 있듯이 사람의 목소리를 분석해 감정과 성격을 추출하는 기술을 개발하고 있음


인간의 목소리는 콘텐츠를 전달할 뿐만 아니라 말하는 사람의 심정을 드러내 주는데, 문화인류학자들은 사람 사이의 대화에서 전달되는 정보의 90% 이상은 말이 아니라 목소리 톤이나 얼굴 표정, 몸짓 등 비언어적 요소에 있다고 말하고 있음


비욘드 버벌감정 분석(Emotions Analytics) 기법은 시장 조사에 응용되고 있으며, 음성에서 질병을 진단하는 연구에 적용되어 큰 성과를 올린 것으로 보고되고 있는데, 이런 연구는 궁극적으로 인간처럼 행동하는 시스템 개발과 연결될 것으로 기대됨



비욘드 버벌이 감정 분석 기술이 적용된 스마트폰용 앱 무디스(Moodies)를 출시하고 있기 때문에, 이 감정 분석 기술은 현재 누구나 이용해 볼 수 있음



<자료> Appstore.


[그림 1] 비욘드 버벌의 무디스 앱


앱을 실행시킨 다음 말을 하면 목소리 톤을 분석해 거기에 배어 있는 감정을 추출하는데, 육성이 아니라 녹음된 음성도 가능하므로 정치인이나 유명인들의 연설 혹은 발언을 입력해 감정 분석을 할 수도 있음


감정은 거짓말을 하지 않는다(Feelings Dont Lie)를 모토로 내세운 비욘드 버벌은 감정 분석 기술을 인정받아 지난 9월 초 300만 달러 투자를 유치하는 등 시리즈 A 펀딩에서 현재까지 총 700만 달러 이상의 투자를 받은 것으로 알려짐


◈ 무디스의 분석 능력을 보여주기 위해 비욘드 버벌은 오바마 미국 대통령이 히로시마 평화 공원에서 행한 연설이 앞쪽 3분을 입력한 후 분석된 결과를 공개하고 있음



<자료> Whitehouse.


[그림 2] 오바마의 히로시마 공원 연설


• 71년 전 구름 한 점 없이 맑은 어느 아침 날에 하들로부터 죽음이 떨어져 내렸고 세계는 달라졌습니다...(Seventy-one years ago, on a bright cloudless morning, death fell from the sky and the world was changed...)로 시작하는 연설은 묵직한 어조로 진행


전쟁의 비참함을 호소하는 연설이지만, 무디스 앱의 분석은 다른 견해를 나타냈는데 서두 부분 오바마 대통령의 심정은 동기 유발(Motivation)이라고 판정하며, 청중을 고무하기 위한 연설이자 동시에 문제에 대한 해결책을 모색하려는 것이라고 해석



<자료> Beyond Verbal.


[그림 3] 오바마 연설의 음성 분석 결과


 연설의 톤은 시간마다 바뀌어, 동기 유발 외에도 위엄(Dominance), 희망(Hope), 친밀감(Friendliness) 등의 분석 결과가 이어지며 연설 도중 심경의 변화가 계속해서 발생했음을 그래프와 함께 보여주고 있음


전반적으로 무디스 앱은 오바마가 해결책을 찾기 위한 노력이 진행 중이라는 것에 대해 심정적으로 긍정적인 평가를 내리고 있음(그래프의 녹색 영역, embracive)


그러나 한편으로는 희망을 전하려 해도 현실은 다르다고 느껴 감정적으로 우울한 평가를 내리는 측면도 있다고 분석하고 있음(그래프의 하늘색 영역, somber)


대부분의 사람에게는 무겁고 고뇌에 찬 연설로 들렸지만, 무디스 앱에 의하면, 오바마 대통령의 심중은 세계 평화를 호소하는 고무적인 감정과 프라하 선언 이후 부진한 핵무기 폐기에 대한 좌절감이 엇갈려 있었음을 알 수 있음


◈ 비욘드 버벌은 감정 분석 기술로 미국 공화당 대선 후보 도널드 트럼프가 폭스 뉴스의 메간 켈리와 진행한 공개 토론회에서의 답변을 분석한 결과도 공개하였음


무디스 앱의 감정 분석에 따르면, 트럼프의 답변에서 느껴지는 감정은 카리스마(Charisma), 창의성(Creativity), 장난끼(Playfulness), 추파(Flirtation), 따뜻함(Warmth) 등임



<자료> Beyond Verbal.


[그림 4] 트럼프 연설의 음성 분석 결과


•  토론회를 TV로 본 사람들은 대체로 트럼프의 발언이 매우 재미 있고 관객을 끌어 당기는 매력이 있다고 느꼈다고 하는데, 감정 분석의 결과 역시 재치 있고 장난기가 풍부하며 엔터테이너로서 탁월한 능력을 보유하고 있음을 보여주고 있음


트럼프는 발언 내용 중 부적절한 표현이나 편향된 인식이 많아 정치인으로서 평가는 대체로 높지 않으며 정치적 수완에 대해서는 물음표가 많이 붙지만, 비욘드 버벌은 트럼프 인기의 비밀이 바로 말의 정서적 측면에 있음을 확인해 주고 있음


◈ 비욘드 버벌은 감정 분석 기술을 기업용 솔루션으로도 제공하고 있는데, 감정에 관한 것이니만큼 주로 시장조사 목적에 활용되고 있음


기업은 제품의 브랜드와 디자인에 대해 조사할 때 감정 분석 기술을 이용해 실제로 어떻게 느끼는 지를 파악하려는 시도를 하고 있으며, 또한 사람들이 실제로 느끼는 광고 효과를 검증하는 데에도 이용하고 있음


조사에 응한 사람들에게 브랜드나 디자인, 광고물에 대한 정서적인 질문을 하고 답변을 녹음한 다음, 이 음성을 감정 분석 기술로 파악해 응답자들이 대상물에 대해 어떤 심정을 가지고 있는지를 분석하는 것임


기업이 알고자 하는 것은 표면적인 대답의 의미가 아니라 음성에 담겨 있는 감정이며, 사람이 겉으로 하는 말은 때론 진실과 다를 수 있고 건성으로 답하는 경우도 있지만 음성에 포함된 신호는 거짓을 말하지 않는다는 전제 하에 가능한 시도임


◈ 한편 현대인들 중에는 자신의 감정을 제대로 이해하는 것이 매우 어렵다고 느끼는 사람이 적지 않은데, 무디스 앱은 일상 생활에서 건강 관리의 도구로도 이용할 수 있음


가령 전화 통화 등을 앱으로 분석하여 그 때의 심정이 어떠했는지를 파악할 수 있는데, 자신은 힘찬 어투로 말했다고 생각했지만 앱으로 분석한 결과가 쓸쓸함(Loneliness)이나 불만족(Unhappy)으로 나올 수도 있음


무디스 앱으로 자신의 감정을 분석해 본 이용자들 중에는 실제로 자신이 생각한 마음가짐과 실제 분석 결과가 다른 것에 놀라는 경우가 많다고 함


건강이 좋지 않을 때는 일부러 약간 큰 목소리로 말하려는 경향이 있으나, 앱으로 분석하면 이런 노력은 실제로는 전혀 먹히지 않음을 알 수 있는데, 심정은 목소리의 크기나 음정과는 상관관계가 없어 이런 잔기술로는 상대를 속일 수 없음을 알 수 있음


건강에 관련한 문제는 빠른 조치가 필요한데, 앱 분석 결과가 좋지 않다면 기분 전환을 할 수 있는 휴식이나 여가 활동 등 건강 관리 활동을 할 필요가 있음


부정적 분석 결과를 받은 이용자들이 기분 전환 후 다시 앱을 실행하면 분석 결과가 긍정적으로 나타나는 경우가 많은데, 이런 사례를 통해 목소리에서 자신의 심리 상태를 판단하여 건강한 생활을 유지하는데 활용할 수 있다는 단서를 발견할 수 있음


실제 비욘드 버벌에 투자를 한 벤처캐피털들은 이들의 감정 분석 기술이, 측정 데이터를 통해 건강을 스스로 관리하는 계량화된 자아 운동(quantified self movement)과 궤를 같이 한다는 점에서 높은 평가를 한 것으로 알려져 있음


◈ 이 감정 분석 기법의 의학적 근거를 정립하기 위해, 비욘드 버벌은 메이요 클리닉(Mayo Clinic)과 스크립스(Scripps) 등 선진 의료기관과 공동 연구를 전개하고 있음


최근 연구 결과에 따르면, 목소리는 실제로 감정을 포함뿐만 아니라 건강 상태의 마커(marker, 표시자)를 내포하는 것으로 나타났다고 함


특히 피험자의 목소리가 심장 질환 관련 신호를 포함하는 것을 발견했는데, 음성 신호가 심장 질환의 바이오 마커가 되므로 음성을 녹음하면 질병을 판정 할 수 있다고 함


이보다 앞서 음성은 자폐증이나 파킨슨병과도 관련이 있음이 밝혀지기도 했으며, 또한 음성과 우울증 및 난독증과의 관계도 해명되고 있는데, 이로써 우리가 하는 말은 건강을 비추는 거울이기도 하다는 점이 규명되고 있음


◈ 음성과 질병의 관계를 의학적으로 해명한 것은 비욘드 버벌이 처음인데, 최근 들어 스마트폰이나 웨어러블 기기로 질병을 진단하는 기술들이 속속 등장하고 있음


 애플은 임상 시험을 위한 플랫폼인 리서치킷(ResearchKit)을 제공하고 있는데, 의료기관은 이 플랫폼을 이용해 단시간에 대규모 임상 시험을 실시할 수 있고, 임상 시험에 참여하는 피험자는 리서치킷에서 제공되는 앱으로 간단한 시험을 실시할 수 있음


파킨슨병에 대한 임상 시험 앱으로는 엠파워(mPower)가 주목 받고 있는데, 이는 비영리 단체인 세이지 바이오네트웍스(Sage Bionetworks)가 개발한 것으로, 피실험자들은 아이폰용 앱에서 지시에 따라 몇 가지 조작을 하면 파킨슨병 여부를 판정 할 수 있음


피험자들은 세 가지 작업을 지시 받는데, 손가락으로 버튼을 누르고 마이크에 ~하고 소리를 내며, 기억력을 시험하는 문제에 답하게 되는데, 피험자들의 테스트 결과를 집계하여 대규모의 파킨슨병 임상 시험을 전개 할 수 있게 되었음



<자료> Sage Bionetworks.


[그림 5] 파킨슨병 임상시험 앱 mPower


◈ 비욘드 버벌은 현재의 컴퓨터는 인간의 감정을 이해할 수 없는 감정맹(Emotional Blind)이라며, 자신들의 최종 목표는 기계에 인간의 감정을 이해시키는 것이라 말하고 있음


비욘드 버벌의 목적은 기계가 감정의 수준에서 인간과 커뮤니케이션 하는 것인데, 이를 위해서는 기계가 인간의 감정을 실시간으로 파악하는 것이 필요하며, 이 정보를 시스템에 피드백 함으로써 컴퓨터가 이용자의 감정에 따라 대응하도록 해야 함


현재 애플 시리(Siri)지금 내가 무슨 일을 하면 좋을까?라고 물어 보면 재미있는 질문이군요(Interesting question)라는 엉뚱한 대답을 받게 됨


만약 시리가 사용자의 말투에서 감정을 이해하게 된다면 인간과 같은 반응을 기대할 수 있는데, 일이 바빠서 피곤하다고 파악하면 시리가 잠깐 휴식을 취하고 차를 마시자고 제안할 수도 있고, 우울할 때는 좋아하는 곡을 재생해 줄 지도 모름



<자료> The Wall Street Journal


[그림 6] 비욘드 버벌 음성 분석 기술 개요


  애플 시리 뿐만 아니라 아마존 에코에 내장된 인공지능 알렉사(Alexa)나 구글홈에 내장된 구글 어시스턴트(Google Assistant)도 사람의 목소리에 들어있는 감정을 이해하고 인간미가 느껴지는 기능을 개발하고 있을 것으로 보이는데, 비욘드 버벌의 기술은 감정을 이해하는 컴퓨터 구현의 기초가 됨


인간과 기계, 인간과 AI의 공존 시대를 이야기하지만, 컴퓨터가 아무리 지능이 뛰어나도 감정을 이해하지 못하는 깡통일 뿐이라는 인식은 인간과 기계 간의 관계 형성에 제일 큰 장벽인 것이 사실


만일 인공지능들이 감정 분석을 통해 인간의 감정을 이해할 수 있다고 하면, 그것이 진정한 감정의 이해인지에 대한 논란은 다시 벌어지겠지만, 최소한 지금까지와는 다른 인간과 기계 간의 감정적 관계 형성이 시작될 수 있을 것이며, 이는 새로운 기계시대로의 진입을 알리는 또 하나의 징표가 될 수 있을 것


댓글을 달아 주세요