Search

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1828호(2017. 12. 27. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

사람 같이 대화하는 AI, ‘소셜봇’ 개발을 위한 아마존의 도전.pdf



[ 요 약 ]


아마존웹서비스 리인벤트 컨퍼런스에서는 아마존의 인공지능 가상 비서 알렉사(Alexa)와 관련한 두 가지 흥미로운 발표가 있었음하나는 알렉사를 기업 업무 시스템과 연결해 직원들의 업무 효율성을 높여 주는 비즈니스용 알렉사알렉사를 통해 회의실 관리나 재고 관리 등이 가능함을 보여주었음또 하나는 알렉사 프라이즈로 사람처럼 대화하는 AI의 개발을 위해 아마존이 주최한 콘테스트였는데수상작들은 아직 미흡하나 사람과 흥미로운 대화가 가능할 수 있음을 보여주었음



[ 본 문 ]


ž 11월말 열린 아마존웹서비스 리인벤트(AWS re:Invent) 2017에서는 두 가지 이벤트가 눈길을 끌었는데, 우선 아마존은 비즈니스용 알렉사(Alexa for Business)를 발표하였음


Ø 비즈니스용 알렉사는 음성 인식 기능을 이용해 업무 자동화를 한 것으로, 음성을 통해 명령을 내리고 필요한 정보를 전달받음으로써 업무 처리의 시간 효율성을 높이는 것이 목적임


<자료> Amazon


[그림 1] 비즈니스용 알렉사 스타터 키트


Ø 소비자용 음성 비서였던 알렉사를 기업용으로 전환한 서비스로, 규칙이 정해진 업무나 단순한 업무를 중심으로 가상 비서가 처리를 대신함으로써 업무 환경을 보다 직원 친화적으로 조성하여 핵심 업무에 집중할 수 있도록 한다는 것


Ø 가령 알렉사가 탑재된 인공지능 스피커 아마존 에코(Echo)를 회의실에 두면 방 예약 및 화상 회의 연결을 말로 지시 할 수 있으며, 문서 출력실에 둔다면 용지가 떨어졌을 때 에코에게 주문을 지시할 수 있어 사무 업무가 편리해 질 수 있음


Ø 아마존은 비즈니스용 알렉사 스타터 키트로 우선 에코, 에코닷, 에코 쇼 3가지 디바이스를 선보였는데, 이 중 에코 쇼(Echo Show)는 기업용 서비스에서 처음 선보이는 디바이스 모델임


Ø 비즈니스용 알렉사는 개인 이용 모델(Enrolled User)와 공유 모델(Shared Device)이 있는데, 전자는 모든 직원이 책상에 두고 개인 업무에 이용하는 형태이며, 후자는 회의실 등 공공 장소에 두고 여러 직원이 공동으로 사용하는 형태임


Ø 현재 소비자용 알렉사가 무료인 반면, 기업용 알렉사 이용은 유료 서비스인데, 요금은 공유 모델이 디바이스마다 월 7달러이고, 개인 이용 모델은 유저 당 월 3달러이며, 기업의 IT 부서에서 디바이스와 이용자 관리를 하게 됨


Ø 비즈니스용 알렉사는 우선 영어, 독일어, 일본어 등 3개국 언어를 지원하지만, 언어별 음성인식 기술의 진전 정도에 따라 이용 국가는 점차 늘어나게 될 것임


ž 아마존이 제시한 비즈니스용 알렉사의 대표적 활용 예는 회의실 관리인데, 시스코, 폴리컴 등 기업 커뮤니케이션 솔루션 업체들과 연계해 알렉사에 회의실 관리 기능을 추가하였음


Ø 우선 각 직원들은 알렉사를 탑재한 기기를 책상에 두고 일정관리 비서로 활용할 수 있는데, 알렉사에게 회의 일정을 질문해 확인할 수도 있고, 다른 팀과 미팅 일정을 잡아달라고 요청하면, 이 요청을 다른 팀의 비서에게 전달한 후 협의하여 일정을 잡아 줌


Ø 회의실에서도 알렉사를 비서로 활용할 수 있는데, 화상회의를 시작해 달라고 요청하면 알렉사가 지정된 번호로 전화를 걸게 되고 모니터에 회의 참가자의 얼굴이 비춰지게 됨


<자료> Amazon


[동영상] 비즈니스용 알렉사의 다양한 활용: 회의 진행 보조와 안내 데스크 역할 등


Ø 프리젠테이션 중에 자료가 필요하다면 알렉사에게 원하는 자료를 보여 달라고 지시할 수 있고, 알렉사는 지난달 매출 실적 등과 같이 업무 시스템에 요청하여 받은 자료가 화면에 보여지도록 처리하게 됨


Ø 회의실 외에도 다양한 장소에 설치하여 활용 방안을 만들어 나갈 수 있는데, 가령 사무실 입구에 알렉사 탑재 기기를 설치해 두면 알렉사가 안내 데스크의 역할을 할 수 있어, 만나고 싶은 직원의 방 위치를 묻는 질문에 답해줄 수 있음


Ø 문서 처리실에 설치해 두면 용지 부족 시에 종이 주문을 명령하는 것 외에도, 컬러 출력 작업을 긴급히 해야 하는데 해당 컬러 프린터에서 흑백 인쇄 작업이 진행 중일 경우, 해당 작업을 흑백 프린터로 옮겨 인쇄할 것을 명령하는 등의 일도 할 수 있음


ž 알렉사의 비즈니스 솔루션은 아마존의 파트너 기업들이 제공하게 되는데, 세일즈포스닷컴, 폴리컴, 컨커 등 유명 기업용 솔루션 업체 외에도 많은 스타트업들이 파트너로 참여 중


Ø 스타트업 (Teem)은 이미 많은 기업에서 회의실 관리에 사용하는 솔루션을 제공 중이며 회의실 입구에 디스플레이를 설치해 룸 이용 현황을 보여주는데, 알렉사와 연동해 음성을 통한 회의실 관리 기능을 제공할 수 있게 되었음


Ø 회의실을 예약 할 때는 방에 설치되어 있는 에코 디바이스에 알렉사, (Teem)에 이 방 예약을 요청해 줘라고 명령하고, 회의실 사용을 시작하면 알렉사 팀에게 이 방 체크인을 요청해 줘라고 말하며, 회의 시간 연장 요청 등도 명령할 수 있음


Ø ERP 솔루션을 제공하는 스타트업 애큐매티카(Acumatica)는 알렉사를 이용하여 재고 관리 시스템을 음성으로 제공하기 때문에, 알렉사, 애큐매티카에 노트북 재고가 얼마나 있는지 물어봐 줘 등과 같이 명령할 수 있으며, 답을 듣고 재고량이 부족하다고 판단하면 알렉사, 애큐매티카에 10개를 주문해 달라고 해줘라고 명령할 수 있음


Ø ERP와 같은 기간 시스템에 접속하기 위해서는 알렉사의 인증 기능을 강화하는 것이 과제가 되는데, 알렉사의 인증 방식은 4자리의 PIN(개인식별번호)을 말로 이야기하는 것이 일반적이나 PIN을 다른 사람이 들을 위험이 있어 성문 등 생체 인식 인증을 준비 중이라고 함


Ø 고급 리조트 호텔인 윈 라스베이거스(Wynn Las Vegas)는 모든 객실에 아마존 에코를 도입하여 활용 중인데 총 4,748 개의 에코가 설치되어 있어 손님들은 호텔과 객실 정보를 프런트가 아닌 에코에 물어볼 수 있음




<자료> Wynn Las Vegas


[동영상호텔 전 객실에 배치된 아마존 에코


Ø 또한 숙박 고객은 음성으로 객실 시설을 컨트롤 할 수 있는데, 알렉사 나 들어 왔어라고 말하면 방의 전등이 켜지며, 알렉사 뉴스 틀어줘라고 말하면 TV가 켜지고 뉴스 채널이 선택됨


Ø 알렉사가 컨시어지 서비스가 되어 손님들을 지원하게 되는 것인데, 호텔 측은 숙박객이 프런트에 전화하는 횟수가 줄어 비용 절감 효과가 있는 것으로 분석하고 있음


ž 미국에서는 AI 스피커가 소비자들에게 대체로 좋은 평을 얻어가고 있는 중이기 때문에, 명령 처리 구현이 상대적으로 용이한 기업용 알렉사 역시 반응이 좋을 것으로 예상됨


Ø 아마존의 워너 보겔스 CTO는 음성을 통해 직원과 시스템이 자연스럽게 상호작용 하는 것이 AI가 기업의 비즈니스에 가져올 첫 번째 파괴적 혁신이라며, 대화형 컴퓨팅이 미래에 어울리는 자연스러운 사용자 환경이라고 비즈니스용 알렉사의 출시 의의를 설명하고 있음


Ø AI 기반 대화형 컴퓨팅은 기술적 측면으로만 보면 소비자용 서비스보다 처리 업무가 구조화되어 있는 기업용 서비스에서 보다 용이하게 구현할 수 있음


Ø 소비자용 AI 음성인식 서비스에서는 일정관리 같이 정해진 태스크를 처리해야 하는 경우도 물론 있지만 이용자의 상황과 감정에 맞게 대화를 나누는 것 자체가 보다 중요한 경우가 있기 때문에 보다 고도의 지능적인(인간적인) AI 기술의 구현이 뒷받침되어야 함


Ø 반면 기업용 음성인식 서비스는 직원의 태스크 처리 지원이 본질적인 기능이기 때문에, 즉 업무 처리를 손이 아닌 로 한다는 인터페이스의 성격이 강하기 때문에 명령어를 정확하게 인식하는 것이 중요하며 사실 인공지능적 기능은 그리 필요하지 않음


Ø 명령어만 올바로 인식이 된다면 그 다음은 기업의 업무 시스템에 그 명령어를 전달하기만 하면 되고, 업무 시스템들이 처리해 준 결과를 다시 이용자에게 전달해주면 되기 때문


Ø 인공지능 스피커를 이용해 본 경험이 있는 직원들이라면 생소함 없이 비즈니스용 알렉사를 이용할 수 있을 것이며, 기업에서 알렉사는 정해진 태스크만 처리하면 되므로 보안 이슈 등으로 인해 인터페이스에 노이즈 발생이 없다면 도입 효과는 높을 것으로 전망해 볼 수 있음


ž AI 스피커와 관련한 아마존의 목표 대화하는 AI의 개발이기 때문에, 이번 리인벤트 2017에서 비즈니스용 알렉사보다 눈길을 끈 것은 아마존의 알렉사 프라이즈 콘테스트임


Ø 알렉사 프라이즈(Alexa Prize) 20분간 사람과 대화할 수 있는 채팅 로봇 개발을 목표로 아마존이 총상금 250만 달러를 내걸고 주최한 경진 대회로 올해가 첫 행사였는데, 올해 9월부터 2개월간 진행되었고 리인벤트 2017 컨퍼런스에서 시상식이 진행되었음


Ø 22개국에서 100개 이상의 대학 팀이 기술을 겨룬 이번 대회에서는 워싱턴 대학 팀이 우승을 차지해 50만 달러의 상금을 받았음


<자료> Amazon


[그림 2대화 AI 개발을 위한 알렉사 프라이즈


Ø AI에게 대화 기법은 매우 어려운 일이어서 영원히 목표에 도달할 수 없다는 의견도 있을 정도인데, 아마존은 알렉사를 통해 이 목표에 다다를 기술을 연구하고 있지만 대학 팀의 연구 참가로 젊은 두뇌들에 의한 돌파구를 기대하며 이번 콘테스트를 개최하였음


ž 아마존은 대화하는 AI소셜봇(Socialbot)이라 부르는데, 소셜봇은 채팅봇으로도 불리며, 알렉사의 스킬(Skill, 앱스토어의 앱에 해당) 중 하나로 분류됨


Ø 소셜봇은 에코를 통해 다양한 화제에 관해 이용자와 음성으로 대화하는데, 연예, 스포츠, 정치, 패션, 기술 등을 대화 화제로 자연스럽게 대화가 진행되도록 하는 것이 개발 목표임


Ø 참가 팀은 아마존에서 제공하는 음성 응용프로그램 개발 환경(Alexa Skills Kit)을 사용하여 소셜봇을 개발하게 되며, 심사위원이 소셜봇과 20분간 대화한 후 회화 능력을 평가하게 됨.


Ø  구체적으로 소셜봇이 화제의 일관성을 가지고 있는지(Coherently), 상대를 끌어 당기는지(Engaging) 등의 능력을 평가하는데, 이는 튜링 테스트(AI가 인간인 척하는 능력의 시험)가 아니고, 어디까지나 회화 능력을 시험하는 것임


Ø 상위 3개 팀의 소셜봇은 공개되어 있으며 아마존 에코에 설치하여 직접 대화해 볼 수 있는데, 실제로 소셜봇과 이야기해 본 사람들은 대체로 기술력이 아직 미완성이어서 대화가 어눌하고 서툴다는 평을 내놓고 있음


Ø 그러나 소셜봇이 꺼내 놓는 주제가 재미있고 입담도 느껴져 대화에 매료되었다는 평도 있으며, 인간 수준에 도달하려면 아직 시간이 걸리겠지만 큰 잠재력이 있음을 실감했다는 의견도 많음


[동영상] 스포츠를 주제로 한 소셜봇과 대화 장면


ž 우승을 차지한 워싱턴 대학 팀의 채팅봇을 비롯해 소셜봇은 이용자의 질문에 반응하는 것뿐만 아니라 AI가 습득한 지식을 기반으로 대화를 주도해 나갈 수 있는 것이 특징임


Ø 아마존 에코에서 소셜봇을 시작하면 소셜봇은 우선 기분은 어떻습니까와 같이 가벼운 인사를 한 후 대화에 들어가는데, 대화 기법에서는 이를 아이스브레이커(Icebreaker)라 부르며 갑자기 본격적인 대화에 들어가는 것이 아니라 우선 딱딱한 분위기를 풀어 주기 위한 것임


Ø 분위기가 풀어졌다고 생각하면 소셜봇은 상대가 흥미를 가질 만한 대화의 주제를 제시하는데 이는 대화 기법 중 토픽 제안(Topic Suggestion)에 해당하는 것으로, 소셜봇은 처음 대화를 갖는 상대에게는 일반적으로 받아들여질 수 있는 화제를 제시함


Ø 소셜봇이 제시한 몇 가지 주제 중에서 가령 인공지능에 관해 이야기하자고 대답하면 소셜봇은 페이스북이 이용자가 올린 사진에서 그 사람의 감정을 추측하는 AI를 개발하고 있다는 등 인공지능과 관련한 몇 가지 재미있는 이야기들을 말해 줌


Ø 이는 대화 기법 중 지식 섭취(Knowledge Ingestion)에 해당하며, 소셜봇은 최신 화제거리를 항상 받아보기 때문에 대화에서 깊은 지식을 내비치며 상대를 끌어 당길 수 있는데, 이는 사람 사이의 대화에서 신선한 화제가 많은 사람이 상대에게 호감을 주는 것과 같은 것임


Ø 소셜봇의 이야기에 대해 어떻게 그런 구조가 가능하지?라고 되묻거나 짓궂은 질문을 던지게 되면 소셜봇은 아직 제대로 답을 하지 못하는 경우가 많음


Ø 상대가 관심을 가지고 있는 사안에 대해 심도 있게 설명하는 것을 대화 기법에서는 심해 잠수(Deep Dive)라고 부르는데, 딥 다이브가 잘 되어야 이야기가 깊어지고 대화가 진행되는데, 현 단계의 소셜봇은 딥 다이브 단계의 대화가 잘 이루어지지 않고 있음


Ø 소셜봇은 비록 대답을 못하더라도 거기서 그치지 않고 인공지능과 관련한 이야기를 계속할까요? 등의 질문을 하는데, 이는 대화 기법 중 대화 주도(Leading Conversation)라 하는 것으로 대화가 중단될 것 같은 경우에 대화를 이끎으로써 계속 이어지게 하는 것임


Ø 소셜봇은 종종 사용자가 원하는 주제를 무시하고 자신이 준비한 이야기를 하는 모습을 보이는데 비록 상대가 소셜봇이라는 것을 알지만 기분이 좋게 느껴지지 않는다는 평을 듣고 있으며, 반대로 사람이 주제를 갑자기 바꾸면 어떻게 된 거냐며 불안한 정서를 내비친다고 함


Ø 소셜봇 이용자들은 대체로 아직 소셜봇과 인간처럼 대화하는 것은 어렵지만 대화의 내용은 재미있고 대화 시간은 10~15분 정도인 것으로 평가하고 있는데, 아마존의 목표가 20분간 대화인 데에서 알 수 있는 아직 연구 개발은 더 지속되어야 할 것으로 보임


[동영상] 영화를 주제로 한 소셜봇과 대화 장면


ž 소셜봇은 아마존의 음성 응용프로그램 개발 환경에서 만들어지므로, 연구 팀은 아마존이 제공하는 음성 인식과 음성 합성 기능을 이용할 수 있음


Ø 음성 인식(Automatic Speech Recognition) 기능은 음성을 텍스트로 변환하는 과정에 이용하며, 음성 합성(Text-to-Speech) 기능은 텍스트를 음성으로 변환하는 과정에 이용하는데, 이를 통해 사람이 하는 말을 시스템이 인식하게 되고 소셜봇의 의도가 알렉사의 목소리로 나오게 됨


Ø 연구 팀들은 음성 인식과 음성 합성의 중간 프로세스에 해당하는 대화 기술을 개발하고 그 기량을 견주게 되는데, 아마존은 원활하게 대화하는 것은 물론이거니와 소셜봇의 입담이나 캐릭터 등도 개발도 목표로 하고 있음


Ø 연구자들은 소셜봇이 흥미로운 주제를 이야기하는 것뿐만 아니라 자신의 주장을 가지고 의견을 말할 수 있는 단계가 시야에 들어왔다고 말하고 있으며, 상대방의 말에 농담으로 답변할 수 있는 단계가 되면 완성도가 부쩍 향상될 것으로 보고 있음


ž 자율운전 자동차 기술이 대학 간의 경쟁을 통해 급진전을 이루었듯, 아마존은 대학의 연구에서 대화하는 AI의 개발이라는 거대한 도전의 목표가 달성될 것을 기대하고 있음


Ø 아마존 에코와 구글 홈의 보급이 폭발적으로 증가하고 있고, 비즈니스용 알렉사가 출시되어 이제 기업에서의 활동도 점차 늘어나게 된다면, 이미 대학에서 뜨거운 연구 주제로 부상한 AI에 대한 연구 열기는 더욱 높아질 것임


<자료> Greg Shank


[그림 3] 알렉사 프라이즈에 참가한 대학들



Ø 자율운전차 기술도 대학 연구팀의 참여가 늘어나며 거대 IT 기업과 자동차 제조업체에 우수 인재들이 진출하게 되고, 새로운 자율운전 관련 하드웨어와 소프트웨어 스타트업들이 등장하며 단기간에 급진전을 이룬 바 있음


Ø 아마존은 음성인식 인공지능 분야에서도 이 같은 연구 열기가 재현되기를 기대하며 2018년에도 알렉사 프라이즈 콘테스트를 준비하고 있음


Ø 또한 대학의 연구 역량과 연계하려는 이런 시도는 비단 아마존뿐 아니라 AI 가상 비서 시장을 놓고 경쟁 중인 구글, MS, 애플 등을 통해서도 전개될 가능성이 높음


Ø 대화하는 AI의 개발이 과연 가능할 것인지, 대화하는 AI가 과연 얼마나 인간에 가까워질 수 있을 것인지, 2018년에 또 하나의 인류의 위대한 도전(Grand Challenge)이 본격화될 것으로 보임