Search

※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1766호(2016. 10. 05 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

구글 새 메신저 알로 발표 대화형 AI의 비즈니스 가능성.pdf



[ 요 약 ]


구글이 9 21일 인공지능(AI)을 탑재한 메시징 앱 알로(Allo)를 출시하였음알로는 현재 많은 사람들이 사용하고 있는 주류 메신저들과 달리기계학습 기반의 스마트 응답 기능과 구글 어시스턴트(Google Assistant)라는 가상의 비서 기능을 탑재하고 있는 것이 최대 특징가상 비서는 대화형 AI로 사용자와 대화는 물론 사용자 간 대화에도 참여해 도움을 주는데아직 개발 도중에 있지만 대화형 AI가 거대 비즈니스로 성장할 가능성의 단초를 보여주고 있다는 평가




[ 본 문 ]



◈ 그 동안 메신저 서비스에서 번번이 고배를 마셨던 구글이, 이번에는 알로(Allo)듀오(Duo)를 출시하며, 큰 호응을 얻고 있음


구글은 4달 전 구글 I/O 컨퍼런스에서 인공지능에 집중하겠다는 비전을 밝힌 바 있으며, 9월 초순 영상통화 앱인 듀오를 먼저 출시한 데 이어, 9 21일 메신저 앱 알로를 발표하였는데, 두 앱 모두 서비스 초기 큰 호응을 얻고 있음




<자료> Google Play.


[그림 1] 구글 알()와 구글 듀오(아래)


• 구글은 지금까지 구글 토크, 구글 챗, 행아웃 등 다양한 메신저 서비스를 내놨지만 번번이 왓츠앱이나 페이스북 메신저 밀렸는데, 알로와 듀오는 초기단계 관심 모으기에 일단 성공한 모양새


알로의 구글이 사용자들의 의사소통과 표현 방식을 학습하기 위해 인공지능을 활용한 첫 번째 메시지 앱으로, 가장 큰 특징 두 가지는 1)기계학습을 기반으로 한 스마트 응답 기능을 선보인 것과, 2)구글의 음성인식 모듈인 구글 어시스턴트(Google Assistant)를 내장한 것


스마트 응답 기능은 대화 맥락에 맞게 자동으로 여러 가지 답장 내용을 제안하는 것이며, 구글 어시스턴트(Google Assistant) 기능 탑재는 AI 기반의 가상 비서와 대화하거나 가상 비서를 사용자 간의 대화에 참여시키는 기능임


구글플레이 통계에 따르면, 9월말 현재 듀오의 다운로드 수는 1천만~5천만 건 구간에, 알로의 다운로드 수는 1백만~5백만 건 구간으로 표시되어 있음


◈ 알로는 사용자 편의성을 높이기 위해 수신 메시지나 사진의 내용을 이해한 후 자동으로 회신 문장을 생성하는 스마트 응답(Smart Reply) 기능을 갖췄음


메시지 수신 후 실시간으로 Sure, Yes, No 등의 간단한 답변 문장을 생성하여 제시하므로, 직접 입력할 필요 없이 터치만으로 회신할 수 있어 편리한데, 이 스마트 응답 기능은 이미 구글의 메일 앱인 인박스(Inbox)에 적용돼 인기를 모은 검증된 기능임



<자료> Google


[그림 2] 알로의 스마트 응답 기능


• 스마트 응답 기능은 사진 수신 시에도 사용할 수 있는데, 가령 공항에서 촬영한 비행기의 사진을 받으면 알로는 비행기 멋지네(Nice plane), 좋은 여행이 되길(Have a nice flight), 여행 잘 다녀와(Bon voyage!) 등의 응답을 자동 생성함


사진을 이해하고 응답을 생성하는 기능에는 고도의 이미지 인식 기능이 적용되어 있는데, 가령 해바라기 사진을 보고 알로가 멋진 해바라기(Nice sunflower)'라는 답변을 생성한다는 것은 객체가 꽃이라는 것뿐만 아니라 해바라기인 것까지 파악한다는 뜻


사람에게는 쉽지만 기계에는 어려운 것이 이미지 인식인데, 기계가 꽃의 종류까지 판단하려면 고도의 기술이 필요하고 배후에는 신경망이 사용되고 있음


◈ 이미지 인식이 쉽지 않다는 사실은 알로가 아직 음식 사진에 대해서는 구체적 응답을 정확히 제시 못하는 데서도 알 수 있는데, 이는 학습시간의 축적에 의해 해결되어 갈 것


• 가령 알로는 위의 해바라기 경우와 달리 샐러드 사진에 대해서는 맛있겠다(Yummy!)먹어보고 싶다(Wish I could try) 정도의 응답 문장만을 생성하는데이는 알로가 음식이라는 것은 이해하지만 요리의 종류까지는 특정할 수 없음을 반증함



<자료> Google


[그림 3] 꽃 종류 구분 가능, 음식 종류 구분 불가


그러나 구글은 이미지 인식 기술에서 세계 최고 수준의 기술을 보유하고 있으며, 요리의 종류를 인식하는 것이 매우 어려운 것은 아니므로 조만간 음식 구분 기능도 알로에 구현될 것으로 보임


알로는 기계학습을 거듭함으로써 이용자의 표현 방법을 배워 가므로, 데이터가 쌓일수록 이용자의 스타일을 반영한 응답 문장을 만들어 제시할 수 있게 될 것임


◈ 메신저 시장에서 승리하기 위해서는 아무래도 젊은층의 관심을 끌 필요가 있는데, 기존 구글의 제품들과 달리 알로는 표현력이 풍부하고 메시지를 그래피컬하게 보여주고 있음


가령 속삭이기 또는 외치기(Whisper or Shout) 기능은 메시지를 입력한 후 보내기 버튼을 누른 상태에서 슬라이드를 따라 위아래로 움직이며 텍스트의 크기를 변경시킬 수 있는데, 위로 올릴수록 문자나 기호가 커지게 됨


또한 알로는 기본적으로 다수의 스티커를 제공하여 메시지 대신 선택하여 표현할 수 있는 폭을 크게 넓혔음


<자료> beeborn


[그림 4] 구글 알로의 텍스트 크기 조정


◈ 알로의 또 다른 특징은 가상 비서를 메시징에 참여시킨 것으로, 구글 어시스턴트가 이용자들 간의 대화에 개입해 도움을 줄 수 있게 하였음


메신저에 가상 비서를 탑재하려는 시도는 오래 전부터 있어 왔는데, 독립된 계정을 갖고 불특정 다수와 메시지를 주고받는 형태의 가장 최근 사례로는 올해 5월에 인종차별 발언으로 서비스가 중단된 마이크로소프트의 채팅봇 테이(Tay)가 있음


이용자의 가상 비서 역할을 하는 채팅봇은 애플의 시리(Siri)를 거쳐 최근 아마존 에코(Echo)까지 점차 활용이 보편화되고 있는 추세임


이용자가 채팅 메시지 내용을 보고 관련된 내용을 자동으로 보여주는 형태로는 인공지능 메신저 마인드멜드(MindMeld)가 주목을 받고 있음


알로는 시리와 마인드멜드를 합쳐놓은 형태로, 마치 컨시어지 서비스처럼 이용자와 대화하며 도움을 주는 한편, 이용자간 채팅을 보고 있다가 도움이 필요하다고 판단하면 대화에 참여해 조언을 해 줌



<자료> Google


[그림 5] 대화 내용을 이해하고 관련 내용 추천


• 예를 들어 친구에게 이탈리아 요리 먹으러 갈까라고 메시지를 보내면, 어시스턴트가 문맥을 이해하고 근처의 이탈리아 음식점을 소개하는데, 여기에는 구글 지식 그래프(Google Knowledge Graph) 기능이 사용되고 있음


지식 그래프는 다양한 정보원으로부터 축적한 시맨틱 검색 정보를 사용하여 검색 결과를 향상시키는 것으로 구글이 사용하는 지식 베이스(전문가 시스템)


어시스턴트가 소개한 레스토랑 카드를 터치하면 상세 정보가 나타나며 매장 사진 등을 볼 수 있는데, 마음에 들면 그대로 예약 할 수 있으며, 단 레스토랑 예약은 전용 앱인 오픈테이블(OpenTable)을 실행시키고 이 앱에서 예약을 하는 구조임


아직 알로에서 직접 예약할 수는 없지만, 올해 구글, MS, 페이스북이 일제히 제시한 채팅봇 메시징 플랫폼이 구현되면 알로가 예약 앱의 채팅봇과 대화를 하며 예약을 처리하게 되므로, 사용자는 알로에게 예약 요청만 하면 될 것임


알로의 대화 참여는 사용자 간의 대화를 뒤에서 누군가 지켜보고 있는 것 같은 좋지 않은 느낌을 주기도 하지만, 사용해 본 이용자들은 대체로 편리한 기능이라는 평가


◈ 가상 비서는 이용자들 간의 대화에만 적용되는 것이 아니며, 당연히 직접 어시스턴트와 상호작용하며 개인 비서처럼 활용할 수 있음


어시스턴트가 지원할 수 있는 작업 유형은 카드로 제시되는데, 뉴스 구독, 타이머 설정 등을 위한 액션(Action), 게임 등을 위한 재미(Fun), 번역, 날씨, 여행, 스포츠, 질의 응답을 위한 대답(Answer), 어시스턴트의 자기 소개인 마이 어시스턴트 등임



• 가령 여행 카드를 터치하면 여행 관련 정보가 표시되며, 조건을 좁혀 가며 희망하는 항공편이나 도착지의 호텔 검색을 할 수 있는데, 여기서도 항공편 및 호텔 예약은 링크된 웹사이트에서 이루어지며 아직 어시스턴트에서 직접 예약할 수는 없음


어시스턴트는 구글 캘린더와 연동해 이용자의 일정을 파악하고 비서처럼 회의 일정 등 관리하는데, 예약해 놓은 항공편의 정보를 보여줄 수 있고, 다음 일정에 대해서도 알려줄 수 있음



<자료> Google


[그림 6] 구글 어시스턴트와 연동해 일정관리


검색을 지시할 수도 있는데, 가령 개 사진 혹은 강아지 사진이라고 말하거나 입력하면, 구글 이미지 검색 결과를 이용해 원하는 사진을 추천해 줌


◈ 구글의 CEO 순다 피차이는 알로의 가상 비서 기능의 도입에 대해, 지금 현재 구글에서 제일 중요한 순간이라며 큰 의미를 부여


피차이는 ‘단지 웹 링크 하나를 던져놓는 것과는 차원이 다르며, 이 순간을 위해 아주 오랫동안 초석을 다져왔다는 말로 높은 기대감을 표시하고 있음


• 구글 그룹 제품 담당 책임 아밋 풀레이는, ‘사용자들은 친구나 가족과 계속 관계를 유지하기 위한 수단으로 메신저를 사용하지만, 대화가 너무 자주 끊기는 것이 문제라며, ‘대화는 그대로 유지하면서 메신저 내에서 모든 검색과 질문을 해결하는 메신저로 알로를 개발했다고 설명


알로의 메시징 기능들은 사실 참신하다고 할 수는 없지만, 구글 측의 기대대로 구글 어시스턴트를 이용한 대화형 AI라는 인터페이스는 편리하다는 느낌을 준다는 평가


어시스턴트가 구글 검색을 이용할 수 있는 인터페이스를 제공하는 것인데, 어시스턴트의 기능 대부분을 음성으로 이용할 수 있다는 것이 상호작용성을 높이고 있음


구글 음성 검색과 알로의 어시스턴트를 이용하는 것에 내용 상의 차이는 없지만, 바로 이 상호작용성이 큰 차이를 만들어 내게 되는데, 알로는 대화형이므로 검색 결과 제시로 끝나는 것이 아니라 계속 대화가 진행될 수 있다는 데서 여러 가능성이 생김


비록 가상 비서지만 대화 상대라는 인식이 생기면, 사용자는 검색 결과를 보고 추가로 말을 걸거나 추가 요청을 하고 싶은 마음이 생길 수 있으며, 이는 곧 알로의 이용시간이 늘어나며 생활의 새로운 플랫폼으로 부상할 가능성을 획득할 수 있음을 의미


• 순다 피차이 CEO가 지금이 구글에서 제일 중요한 순간이라 말한 것은 이런 맥락일 것이며, 바꿔 말하면 구글에 지금 가장 필요한 것은 알로의 성공이라 할 수 있음


◈ 일각에서는 알로가 유력 메시징 플랫폼으로 부상하며 구글의 AI 비즈니스를 진일보시킬 수도 있겠지만, 프라이버시 이슈 등에 대한 현명한 대처가 전제되어야 한다는 점을 지적


인공지능과 메신저의 결합은 분명 성장 가능성이 가득한 기회의 땅으로 부상할 수 있으나, 알로의 인공지능 기능은 프라이버시를 침해하는 존재가 될 수도 있음


사용자들이 알로에서 인공지능 기능을 활용하려면 구글에 연락처, 대화 내용, 상세한 개인 정보 등의 접근 권한을 허락해야만 하기 때문임


이런 이슈에 대한 대응으로 알로는 보안 옵션을 두고 있는데, 익명 모드(Incognito Mode)를 선택하면 알로의 메시지는 암호화 되며, 또한 스냅챗(SnapChat)처럼 메시지 노출 시간을 10초로 설정해 놓으면 10초 후 메시지가 자동으로 사라짐



<자료> Google


[그림 7] 구글 알로의 익명 모드와 메시지 자폭


메시지 자폭은 스냅챗이 10대들의 인기를 단박에 끌어 모을 수 있었던 핵심 기능으로 주목적은 성적인 대화와 사진 전송 기록이 남지 않도록 하는 것임


알로를 일반 모드로 사용하면 메시지가 암호화되지 않는데, 해시 처리(HTTPS의 프로토콜)에서 최소한의 보안이 제공되기는 하지만 알로는 분명 도청에 약점이 있음


페이스북 메신저 역시 암호화 옵션(비밀 대화)을 지정하지 않으면 메시지가 암호화되지 않는 등 이 문제는 비단 알로 만의 이슈는 아니나, 알로의 경우 메시지를 암호화하게 되면, 알로가 이용자간 대화에 참여하는 핵심 기능을 사용할 수 없는 문제가 발생


◈ 구글은 당초 방침을 바꿔 알로에서 주고 받는 메시지를 장기 보관하기로 결정했는데, 메시징 비즈니스라는 신대륙과 프라이버시 사이에서 고민하는 흔적을 볼 수 있음


구글은 알로에서 주고받는 메시지를 일시적으로 사용할 수 있지만 장기적으로 서버에 보관하는 것은 아니라고 했으나, 이 방침을 바꾸어 메시지 장기 보관 원칙을 밝혔음


보관의 목적은 AI의 교육에 사용할 데이터를 모으기 위함인데, AI를 보다 지능적으로 만들기 위해서는 기계학습이 필요하고, 기계학습을 위한 가장 좋은 교재는 결국 사용자들 간의 대화 내용이므로 장기간 보관을 단행할 수밖에 없었다는 것


이에 대해 당연히 우려의 목소리도 높은데, 전직 CIA NSA 요원인 에드워드 스노우든은 구글이 보관한 메시징 데이터가 범죄 수사 등에 이용될 것을 우려하며, 알로를 사용하지 말 것을 호소하고 있음


알로 역시 스마트 기술의 장점과 프라이버시 침해 기술의 단점을 동시에 지녔기 때문에, 초기의 관심 만을 놓고 알로의 성공이 보장된 것이라고는 말할 수는 없을 것이며 개인정보보호화 스마트 기능 사이의 균형이라는 오래된 숙제를 풀어야 하는 입장


AI 기술의 발전에 따라 인간과 기계의 협업이 새로운 화두로 떠오르고 있는 지금, 알로의 등장은 대화형 AI가 거대 비즈니스로 성장할 가능성의 단초를 보여주고 있음


알로는 현재 미리보기 판(Preview Edition)으로 표시되어 있으며, 사용해 보면 아직 개발 과정 중에 있는 베타 제품이라는 인상이 강하며, 생활의 필수 플랫폼이 될 것이라고 확실히 말하기 어려운 상태


반면 알로는 인간과 기계의 관계라는 측면에서 큰 잠재력을 보여주고 있는데, 특히 어시스턴트와 상호작용 하는 인터페이스에서 온기를 느낀다는 평가가 다수


음성 검색에서 기계적으로 결과를 표시하는 것과 달리, 가상 비서와 말을 주고 받으면서 목적을 달성 할 수 있다는 것은 미래의 모습을 미리 보여주는 것이기도 함


구글이 AI 비즈니스에 전사적 노력을 쏟아 붓고 있고 알로는 그 로드맵의 첫 단추인 만큼 향후 알로의 기능은 보다 정교화 되고 다양해질 것이며, 이는 필연적으로 경쟁 서비스들의 등장을 불러 일으키며, 또 하나의 새로운 비즈니스 영역이 구축될 전망