※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1780호(2017. 1. 25 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

하이브리드 AI로 변신 꾀하는 우버.pdf



[ 요 약 ]


2016년 말 우버(Uber)는 인공지능(AI) 벤처를 인수하고 인공지능 연구소를 설립하며 통계 모델과 확률 모델을 결합한 하이브리드 AI 기술을 개발한다고 발표하였음. 연구의 성과는 우선 인간처럼 스마트하게 운전할 수 있는 자율운전 자동차의 개발에 적용될 것이나, 향후 항공기와 로봇 비즈니스에도 적용될 계획이라고 함. 차량 공유와 택시 운송 기업인 우버는 여타 AI 선도기업들과는 다른 기술 방식으로 AI 연구를 추진하며, 자신들의 비즈니스 영역을 크게 변화, 확충시키려 하고 있음



[ 본 문 ]


◈ 우버(Uber)는 작년 12월 샌프란시스코에 인공지능 연구소 'Uber AI Labs(우버 AI)'를 설립하며, 아울러 AI 벤처기업 'Geometric Intelligence(지오메트릭 인텔리전스)'를 인수한다고 발표


우버 AI 랩은 Deep Learning(딥러닝, 심층학습)Machine Learning(머신러닝, 기계학습)을 중심 테마로 연구 개발을 진행할 계획이라고 함


인수한 지오메트릭 인텔리전스의 연구원 15명이 우버 AI랩의 구성 멤버가 되며, 초대 연구소장은 인수 기업의 CEO인 개리 마커스(Gary Marcus)가 맡았음



<자료> MIT Technology Review


[그림 1] 지오메트릭 인텔리전스


◈ 우버가 인수한 지오메트릭 인텔리전스는 적은 양의 데이터를 가지고 알고리즘을 교육할 수 있는 새로운 딥러닝 개발에 집중하고 있는 기업으로 추정됨


지오메트릭 인텔리전스에 관한 내용은 언론을 통해 거의 알려져 있지 않은데, 마커스 등이 설립한 이 기업은 논문 등 외부 발표를 하지 않고 스텔스 모드로 연구를 하고 있기 때문


단지 마커스가 업계의 유명 인사이사 보니 강연 등을 통해 지오메트릭 인텔리전스에 대한 내용을 간혹 언급할 뿐인데, 이를 토대로 추측해 보면 이 기업은 '적은 양의 데이터'로 딥러닝과 같은 성과를 낼 수 있는 새로운 AI 기법을 개발 중인 것으로 보임



일반적으로 딥러닝을 통해 객체를 판정할 수 있게 하려면 대량의 사진 데이터를 가져 와 알고리즘을 교육할 필요가 있음


이미 병원 현장에 투입되어 인간 의사를 곧 넘어설 것으로 평가 받고 있는 의료용 AI 등은 방대한 양의 데이터를 토대로 스스로 학습한 결과 만들어 진 것임


이에 비해 지오메트릭 인텔리전스는 인간이 사물을 인식하는 것과 같은 방식으로, 적은 양의 데이터만 가지고도 이미지를 판정할 수 있는 알고리즘의 개발을 연구의 주요 테마로 하고 있음


소량의 데이터 영문 표현은 'Sparse Data인데, 이는 데이터 표본 자체가 작은 '희귀 데이터'라는 의미가 아니라, 가능한 많은 데이터를 모아 놓은 빽빽한 데이터 집합이 아니라 '듬성듬성한(성긴) 데이터'라는 뜻임


◈ 우버 AI 랩의 마커스는 기존 딥러닝 방식을 통해 자율운전 차량 알고리즘을 개발할 때의 문제점을 들며, 자신들은 알고리즘 개발 기간을 대폭 단축하는 것이 목표라고 설명.


일반적인 딥러닝 방식으로 자율운전 자동차를 개발하려면 주행 중에 발생하는 모든 이벤트에 대해 학습할 필요가 있으며, 이 때문에 비나 눈이 오는 궂은 날의 주행 환경에 대한 데이터의 수집이 필요하게 됨.


따라서 일년 내내 날씨가 좋은 캘리포니아 지역을 떠나 다른 지역에서의 주행 시험도 필요하게 되는 것이며, 자동차, 드론, 로봇 등을 포함한 모든 자율 시스템을 개발할 때는 알고리즘 교육에 사용되는 다량 데이터의 확보가 가장 큰 걸림돌이 되는 것


지오메트릭 인텔리전스는 바로 이 문제를 해결해 소량의 데이터로 알고리즘을 교육함으로써 개발 기간을 대폭 단축할 것을 목표로 설립되었다는 것이 마커스의 설명


◈ 지오메트릭 인텔리전스의 또 다른 큰 특징은 '하이브리드 AI' 기술을 개발하는 것인데, 딥러닝 뿐 아니라 기존 방식의 AI 개발에도 자원을 집중하고 있음.


마커스에 따르면 연구소는 'Bayesian Model(베이즈 모델, 계층 구조의 통계 기법)' 'Probabilistic Model(확률 모델, 확률분포의 통계 기법)' 등의 연구를 진행하고 있음


이들 모델은 딥러닝의 근간을 이루는 기술 중 일부이지만, 딥러닝의 등장으로 그 존재감이 희미해져 가고 있고 연구자들 사이에 인기가 사그라져 가고 있는 것이 사실


지오메트릭 인텔리전스는 이런 기존 모델을 개선하고 딥러닝과 함께 사용하는 기법을 개발하며 이를 하이브리드 AI라 이름 붙이고 있는데, 규칙 기반의 학습 모델(기계학습)과 통계 기법의 학습 모델(딥러닝)을 결합한 접근방식이라 할 수 있음


많은 자율운전 차량 개발 업체들이 딥러닝 만으로 알고리즘을 구현하고 있는 반면, 우버 AI랩은 다양한 기법을 혼용하는 것에서 차별성을 모색하려는 것으로 보임


◈ 이런 하이브리드 접근방식의 배경에는, 딥러닝 만으로는 막다른 골목에 다다르게 될 것이라 는 마커스의 뚜렷한 주관이 자리잡고 있음


마커스는 딥러닝이 한계에 다다르게 될 수밖에 없는 이유로, 시스템 교육에 많은 양의 데이터가 필요한 반면 적용할 수 있는 분야는 제한된다는 점을 들고 있음


실제 세계에서는 많은 데이터가 갖추어져 있는 것이 아니며, 특히 언어 분석과 자율운전 기술에서 이 문제는 더욱 뚜렷이 나타난다고 마커스는 지적함



• 대안적 방법으로 마커스는 심리학, 언어학, 생물학적 관점에서 인간의 인텔리전스에 다가가려 하고 있는데, 마커스 뉴욕대학 교수의 전문 분야가 바로 심리학임



<자료> http://www.psych.nyu.edu/gary.


[그림 2] 게리 마커스(뉴욕대학 심리학과)


우버가 자율운전 알고리즘을 마커스 소장의 하이브리드 AI 기반으로 구성하게 되면, 이미지 인식 쪽은 딥러닝을 사용하여 적은 데이터로 알고리즘을 교육하게 되고, 운전 기술 습득 쪽은 규칙 기반의 학습 모델을 사용하게 됨


운전 기술 습득을 위해서는 일반적인 운전 규칙뿐만 아니라 각 지역에 고유한 운전 규칙을 학습할 필요가 있는데, 지역별로 다른 운전 매너의 차이점은 규칙 기반의 학습 모델을 통해 흡수, 수용하게 됨


◈ 우버가 새로운 기술 방식의 AI랩을 설립하게 된 것은, 현재 우버의 자율운전 기술 수준에 대해 우려와 불안의 눈초리가 존재한다는 사실과 무관하지 않아 보임


우버는 지난 2015 2월 자율운전 차량 개발 거점으로 Uber Advanced Technologies Center(우버 선진기술 센터)를 피츠버그에 설립한 바 있으며, 여기에서 카네기멜론 대학과 공동으로 자율운전 기술 및 지도 제작 기술을 개발하고 있음


우버는 작년 9월부터 피츠버그에서 'Self-Driving Uber(셀프 드라이빙 우버)'라는 자율운전 브랜드의 차량을 시험 영업, 즉 실제 손님을 태우는 시험 주행을 전개하고 있음


셀프 드라이빙 우버는 볼보(Volvo) XC90 모델 차량에 자율운전 기술을 탑재한 것으로, 누구나 우버 앱을 통해 이용할 수 있는데, 만약 배차된 차량이 자율운전 차량이라면 시험 영업의 취지를 앱으로 통보하여 이용자가 선택할 수 있도록 하고 있음


<자료> Wired


[그림 3] 셀프 드라이빙 우버의 태블릿 UI


• 차량 내에 구비된 태블릿이 자동차와 커뮤니케이션 하는 인터페이스가 되는데, 승객이 안전 벨트를 장착하고 태블릿에서 시작 버튼을 누르면 주행이 시작되며, 주행 중에는 차량에 탑재된 각종 센서로 파악한 차량 주변의 이미지를 포함해 운행 상황에 대한 정보가 태블릿에 표시됨


무인 주행시 승객을 안심하게 만드는 기능들을 탑재하고 있는데, 태블릿으로 셀카를 찍은 다음 이를 가족, 친구와 공유할 수 있도록 하고 있음


셀프 드라이빙 우버는 자동으로 주행하지만 운전자가 탑승해 시스템이 대응할 수 없을 때 운전을 대신하는데, 피츠버그의 시험 영업에서는 자동차가 운전자의 도움 없이 주행할 수 있는 거리가 한정되어 있어 자주 운전자가 개입했다는 평가가 나왔음


또한 자율주행 모드에서는 다른 차량에 너무 가까이 붙어 주행하는 등 불안정한 작동들이 있었다고 보고되고 있음


◈ 작년 12월에는 피츠버그에 이어 샌프란시스코에서 셀프 드라이빙 우버의 시험 영업을 시작했는데, 법률 공방에 가려졌지만 여기서도 자율운전 차량의 안전성이 도마에 올랐음


셀프 드라이빙 우버가 적색 신호에서 횡단보도를 무단으로 지나간 것이 옆 차선 운전자의 블랙박스에 의해 촬영되었고, 이것이 뉴스에 크게 보도된 것


우버는 신호 위반 당시 운전자가 운전을 하고 있었고, 따라서 시스템 오류가 아니라 사람의 잘못이라고 해명했으나 사실을 뒷받침할 만한 근거자료는 제출되지 않았음


[동영상] 적색 신호를 위반하고 횡단보도를 가로 지르는 우버 자율주행 택시


한편 자전거 차선이 있는 도로에서 셀프 드라이빙 우버가 불법으로 우회전 하는 문제도 지적되고 있음


규정에 의하면 차량 주행 차선에 있다가 점선 구간에서 자전거 레인에 들어선 후 오른쪽 차선에서 우회전해야 하며, 주행 차선에서 곧장 우회전 할 수는 없는 것인데, 우버 차량이 이 의무를 무시하고 있다는 것


우버는 이 문제를 인정하고 이미 소프트웨어 버그를 수정했다고 하는데, 구글의 자율주행 차량 웨이모(Waymo)는 이미 규칙으로 구현하고 있는 기능임


<자료> Huffington Post


[그림 4] 자전거 차선과 병합되어 있는 도로의 우회전 규칙


• 이런 문제와 함께 우버와 캘리포니아 정부의 규정 준수 논란이 겹치며, 소비자들은 안전성에 의구심을 갖게 되었고, 전문가들 역시 셀프 드라이빙 우버의 기술 완성도가 낮다고 지적하며 시험 운영은 시기상조라는 우려의 목소리를 표명하고 있음


◈ 우버와 캘리포니아 정부 사이의 법적 논란에 대해서도 우버 측 주장에 모순이 있다는 지적이 많은데, 한마디로 기술적 완성도에 비해 마케팅을 너무 앞세운다는 비판임


캘리포니아에서 자율운전 차량을 시험 주행하려면 자동차 운행을 관할하는 Department of Motor Vehicles(DMV, 차량관리국)으로부터 허가를 받을 의무가 있는데, 우버는 이러한 인가 절차를 밟지 않고 시험 영업을 시작하였음


캘리포니아 주정부는 이를 인정하지 않고 시험 차량이 운행정지 명령을 내리는 동시에 등록하지 않으면 시험 주행 차량의 등록을 말소하겠다는 강경 대응을 하였음


우버는 자율운전 차량의 시험 승인을 받을 필요가 없다는 견해를 표명했는데, 그 이유는 셀프 드라이빙 우버가 자율운전 차량의 정의에 해당하지 않는다고 보고 있기 때문


DMV는 자율운전 차량을 '운전자의 제어 없이 운행하는 차량'으로 정의하고 있는데, 셀프 드라이빙 우버는 운전자가 제어하면서 운행하는 차량이기 때문에 이러한 정의에 맞지 않는다는 것이 우버의 주장임


, 셀프 드라이빙 우버는 고급 운전 지원 기술로 테슬라의 오토파일럿(Autopilot)과 같은 방식으로 운행을 제어하고 있기 때문에, 테슬라의 오토파일럿 모드 주행에 별도 승인이 필요하지 않은 것처럼 자신들도 허가 받을 필요가 없는 것으로 해석해야 한다는 것


우버는 법의 구멍 빠져 나가려 하는 것이 아니라 자율운전 차량 관련 법규를 명확히 하려는 것이라며, 우선 자율주행 차량의 법적 정의부터 명확히 할 것을 요구하고 있음


우버의 주장에 대해 캘리포니아 정부는 고급 운전 지원 기술이라면 자율주행 차량임을 강조하지 말 것을 요구했는데, 우버가 거론한 테슬라의 경우 오토파일럿 기능은 어디까지나 시험적인 기능이며 자율주행 차량이 아니라는 점을 표시하고 있음


우버가 법규 준수와 관련해서는 스스로 기술적 완성도가 높지 않음을 내세우면서 소비자들에게는 자율주행을 강조하는 것은 모순된다는 것이며, 특히 생명의 안전과 관련된 자동차라는 점에서 엄격한 법 적용을 할 수밖에 없다는 것이 캘리포니아 정부의 입장


우버와 DMV는 자율운전 차량의 시험 인증에 대해 후속 협의를 했으나 인증의 필요성에 대한 입장 차이는 좁혀지지 않았고, 이에 따라 DMV는 우버의 시험 차량 16대의 등록을 말소했고 우버는 이튿날 우버의 시험에 호의적인 애리조나로 차량을 이동시켰음


<자료> record


[그림 5] 캘리포니아에서 애리조나로 이동하는 우버 무인 택시


◈ 이런 상황을 감안하면 신설된 우버 AI 랩의 임무는 자율운전 기술을 비약적으로 발전시켜 안전성 논란을 없애고, 궁극적으로 완전한 무인 주행에 도달하는 것이라 할 수 있음


캘리포니아 정부와 마찰이 있었지만, 우버가 샌프란시스코에 설립한 AI 랩의 위치도 옮길 것으로 보이지는 않음


샌프란시스코는 우버가 맨 처음 사업을 시작한 곳이라는 상징성이 있으며, 도로 환경 면에서도 자전거가 많고 도로는 좁으며 교통량이 많은 곳이므로, 자율주행 차량의 기술 개선을 위해서는 어찌 보면 반드시 테스트를 수행해야 할 조건을 갖추고 있기 때문


규정을 굳이 따르지 않은 것도 장차 당국과의 협상을 유리하게 진행하려는 의도가 있다는 분석인데, 우버는 기존 법규나 기존 사업과 충돌을 낳는 사업을 하고 있기 때문에 법령을 자신들에 유리하게 개정하기 위해 규제 당국과 정면 대결을 협상 전략으로 택했다는 것


비록 캘리포니아 정부가 주민의 안전을 최우선으로 고려해 엄격히 규정 적용을 했지만, 하이테크 기업이 이에 반발해 떨어져 나갈 수 있다는 것을 보여줌으로써, 장차 안전을 우선으로 할 지 아니면 혁신 기업 육성을 선택할 것인지 압박을 가하게 되었다는 분석


◈ 우버는 AI 랩의 연구 성과를 자율주행 차량에 한정하지 않고 항공, 로보틱스로 확장한다는 계획이며, 이에 따라 우버의 정체성은 2017년을 계기로 향후 크게 탈바꿈할 것으로 예상


우버 AI 랩이 샌프란시스코를 떠나지 못할 또 다른 이유는 우버가 AI 랩의 연구 성과를 자율운전 기술뿐 아니라 비행기와 로봇 등에도 적용할 계획이라는 데서 찾을 수 있음



• 우버는 작년 10월 주문형 항공 운송 서비스 'Uber Elevate(우버 엘리베이트)'를 발표하였는데, 파일럿이 존재하지 않는 항공기로서 항공 분야의 셀프 드라이빙 우버로 부를 수 있음



<자료> Uber


[그림 5] 무인 항공 수송우버 엘리베이트


우버 엘리베이트는 샌프란시스코와 산호세 사이 70 킬로미터 구간을 15분에 연결한다는 계획인데, 운임은 129 달러로 우버의 고급 세단 차량 서비스인 우버 X와 유사한 수준이 될 것이라 밝히고 있음


우버는 아직 로봇에 대해서는 구체적 제품 계획을 발표하고 있지 않지만, 다른 기업들과 마찬가지로 연구 진척에 따라 조만간 선보이게 될 것이라는데 이견이 없음


우버는 2017년을 계기로 운송 비즈니스 기업에서 AI·로보틱스 비즈니스 기업으로 변신을 꾀할 것으로 보이며, 하이브리드 AI를 내세운 우버 AI 랩의 연구성과에 따라 변화의 속도가 정해질 것으로 보임

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1778호(2016. 12. 28 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

풀이과정을 알 수 없는 인공지능에 대한 신뢰성.pdf



[ 요 약 ]


딥러닝(Deep Learning)을 응용한 시스템의 활용이 사회 각 분야로 확산되고 있으나, 동시에 AI의 문제점도 명확히 드러나고 있음. 문제 제기의 핵심은 AI를 믿을 수 있는가 하는 것인데, 이는 AI의 결정 메커니즘을 사람이 온전히 알 지 못한다는 점에서 기인함. 의사보다 암 진단 정확도가 높지만, AI가 왜 그렇게 판단했는지를 모르기 때문에 신뢰성의 문제가 제기되는 것이며, 따라서 2017년에는 AI의 작동 메커니즘을 규명하려는 움직임이 적극 전개될 것으로 예상



[ 본 문 ]


◈ 인공지능(AI) 활용 시도가 다양하게 전개되면서, 사람들은 점차 인공지능(AI)을 과연 신뢰해야 하는가라는 문제에 직면하고 있음


딥러닝(Deep Learning) 기법을 응용한 다양한 인공지능 시스템 활용 사례가 속속 소개되며 기대감이 커지고 있으나, 동시에 AI의 문제점도 명확해지고 있음


AI는 통계학적 수법을 통해 입력된 데이터로부터 어떤 특징의 양을 정밀하게 감지하며 의사결정을 내리는데, 사람들을 곤혹스럽게 하는 점은 AI가 왜 그런 의사결정을 내렸는지에 대해 설명해 주지 않기 때문임


가령 자율운전 차량은 인간보다 훨씬 안전하게 주행할 수 있다는 것이 실험을 통해 입증되고 있지만 그 운전 기술의 요체는 AI 개발자들도 모르며 오직 AI만 알고 있기에, 사람들은 안전할 거 같긴 한데 믿을 수 있을까라는 애매한 감정을 갖게 됨


구글 딥마인드는 바둑 인공지능 알파고를 개발하며 바둑의 규칙조차 입력하지 않았지만, 대결에서 패한 인간 최고수로부터 바둑을 이해하는 새로운 관점을 얻게 되었다는 찬사를 이끌어 냈는데, 이런 사실에 사람들은 기대감과 불안감을 동시에 느끼는 것


사정이 이렇다 보니 사람들이 느끼는 불안감 속에는, 사람이 AI를 이해하지 못하는 것이 아닌지, AI가 사람을 능가하는 것은 아닌가 하는 존재론적 의심도 배어 있음


AI에 내포된 이런 본질적 문제는 다양한 형태로 드러나고 있는데, 중국계 AI 연구자들이 최근 발표한 얼굴 특징으로 범죄자를 식별하는 기술은 큰 논란을 낳고 있음


상하이교통대학(Shanghai Jiao Tong University)은 지난 11 13얼굴 이미지를 이용한 범죄연관성에 관한 자동화된 추론(Automated Inference on Criminality using Face Images)이라는 논문을 공개


공개된 지 얼마 안되어 아직 피어 리뷰(동료 전문가 평가, peer review)도 끝나지 않았지만, 논문에 따르면 알고리즘은 89%의 정확도로 범죄자를 식별한다고 하는데, 즉 얼굴 사진을 알고리즘에 입력하면 그 사람이 범죄자인지 여부를 거의 알 수 있다는 것


이 연구에는 딥러닝 등 얼굴인식 AI 기술이 사용되었으며, 알고리즘을 훈련시키기 위해 남성 1,856명의 얼굴사진을 사용했고 그 중 730명이 범죄자였다고 함




<자료> Xiaolin Wu & Xi Zhang


[그림 1] 얼굴인식 AI 기법을 이용한 범죄자 식별 가능성 연구


• 논문은 범죄자의 얼굴에 세 가지 특성이 있다고 언급하고 있는데, 윗입술의 선이 보통 사람에 비해 급격히 내려가고(그림1 오른쪽 이미지 속의 p), 두 눈의 간격이 좁으며(d), 코와 양 입가 사이에서 만들어지는 각도가 좁다(θ)는 점을 들고 있음


이 논문은 현재 논란의 와중에 있는데, 인물의 행동에서 범죄자를 식별하는 방법은 이미 감시 카메라 등으로 사용되고 있지만, 얼굴의 특징으로 범죄자를 가려낸다는 AI를 믿을 수 있는가 하는 의문이 제기되고 있는 것


AI는 학습 데이터를 바탕으로 통계 처리를 하는 것이지, 얼굴의 모양과 범죄자를 연결시키는 논리가 아닌데, 만일 AI가 범죄 수사에 사용된다면 일반 시민들이 이유를 알지 못한 채 용의 선상에 오르게 될 지도 모른다는 우려가 나오고 있음


◈ 딥러닝이 사회문제가 될 수 있는 불씨는 도처에 도사리고 있는데, 세계 최첨단 AI 기술력을 보유한 구글 역시 AI와 관련해 인종차별 이슈로 문제점을 지적받고 있음


구글의 유튜브는 청각 장애인을 위해 동영상 속의 음성을 자막으로 표시하는 기능이 있는데, 구글은 이 기능에 AI를 사용하고 있음


미국국립과학재단(National Science Foundation)의 레이첼 태트먼(Rachael Tatman) 연구원은 유튜브의 캡션 기능에서 동영상 속 화자가 남성일 경우와 여성일 경우 캡션의 정확도가 다르지 않은가에 대해 조사를 실시하였음


<자료> Rachael Tatman.


[그림 2] 구글 음성인식의 성별 편견


• 그 결과 유튜브는 남성의 목소리를 여성의 목소리보다 정확하게 인식하는 것으로 나타났는데, 남성일 경우 인식 정확도는 60%이지만, 여성의 목소리일 경우 정확도는 47%로 내려가 음성인식에서 여성이 차별을 받고 있는 것으로 나타남


이 차이가 발생하는지에 대해 시스템을 자세히 검증할 필요가 있는데, 태트먼은 AI 훈련에 사용된 음성 데이터 샘플이 성별로 균등하지 않고 남성에 치우쳤기 때문인 것으로 추측


AI의 성능은 훈련 자료의 품질에 민감하게 좌우되는데, AI의 여성 차별과 인종 차별 문제가 표면화됨에 따라, 훈련 데이터의 공정성 여부가 추궁 당하고 있음


◈ 사람의 생명과 직결되는 의료 분야에서도 인공지능에 의한 판단과 결정을 어떻게 해석하고 검증할 것인지에 대한 논의가 시작되고 있음


딥러닝 기법은 최근 유방암 검사의 판정에서 성과를 올리고 있는데, 검체의 의료 이미지(CT 촬영사진, x-레이 사진 등)를 딥러닝 네트워크에 입력하면 AI는 암이 발병한 조직을 정확하게 검출해 냄


현재 AI의 유방암 진단 정확도가 인간을 웃돌기 때문에, 많은 병원에서 정밀한 치료를 위해 이 시스템의 도입을 시작하고 있음


그러나 동시에, 건강해 보이는 조직을 AI가 암 발병 가능성이 높다고 판정한 경우, 의사와 환자가 어떻게 대응해야 할 지가 논란이 되고 있는데, AI 판정만 믿고 몸을 여는 수술을 해야 하는지 어려운 판단을 내려야 하는 압박을 받게 됨


물론 유전자 검사에서도 동일한 문제가 발생하고 있으며, 유방암 발병을 촉진하는 유전자 변이인 BRCA가 검출될 경우 수술을 해야 하는지 여부가 논란이 되고 있음


여배우 안젤리나 졸리는 BRCA1 변이 유전자를 보유하고 있으며 유방암 발생 확률이 87%라는 말을 듣고 아직 암이 발병하지 않았음에도 유방 절제술을 받은 바 있음


그러나 AI에 의한 검진의 경우는 이와 다른데, AI는 변이 유전자 보유라는 확실한 근거를 토대로 발병 확률을 제시하는 것이 아니며, 통계적 방법으로 유방암 여부를 판단할 뿐 그 조직에서 왜 암이 발병하는 지는 설명하지 않기 때문


이런 이유로 인공지능은 종종 인공 무능으로 조롱받는 것이며, 과학적 근거가 없는 결정을 어떻게 해석해야 할 지에 대해 의학적 검증 노력이 시작되고 있음


◈ 은행이나 핀테크 스타트업들도 최근 대출 심사에서 딥러닝을 사용하기 시작했는데, 심사 결과에 대해서는 대체로 만족도가 높지만 현행 법과 배치되는 문제가 발생하고 있음


AI 대출 심사의 장점은 신청자의 데이터를 알고리즘에 입력하면 즉시 위험도를 평가할 수 있고 높은 정확도로 단시간에 대출 심사가 할 수 있다는 것


한편, 미국 대부분의 주 정부는 은행이 대출 심사를 통과하지 못한 사람에게 그 이유를 설명하도록 의무화 하고 있는데, 딥러닝은 그 과정이 깜깜이여서 은행은 탈락한 신청자에게 이유를 충분한 설명하지 못하게 됨


게다가 대출 심사 기준을 바꿀 때마다 알고리즘을 재교육하는데, 소프트웨어의 로직을 변경하는 것이 아니라 대량의 데이터를 읽어 들여 딥러닝의 변수를 다시 설정하게 하기 때문에 금융업계에서 AI 도입을 두고 찬반 논란이 일고 있음


AI의 작동 알고리즘을 정확히 알지 못할 경우, 경험적으로 알게 된 AI 알고리즘의 맹점을 활용한 공격에 인증 시스템이 오작동 할 위험이 있음을 증명하는 실험도 있음


카네기 멜론 대학의 마무드 샤리프 교수 등은 안경으로 얼굴 인증 시스템이 오작동하도록 만들 수 있다는 내용을 담은 논문 최신 얼굴 인식 기술에 대한 실제적이고 눈에 띄지 않는 공격(Accessorize to a Crime: Real and Stealthy Attacks on State-of-the-Art Face Recognition)을 발표하였음


실험에 의하면 안경테의 폭이 약간 넓은 안경을 쓰면 시스템이 얼굴을 인식할 수 없게 되며, 따라서 방범 카메라의 감시 시스템을 빠져 나갈 수 있는 여지가 생김


<자료> Mahmood Sharif et al..


[그림 3] 간단한 트릭으로 얼굴인식 AI 교란


• 또한 안경테의 색 패턴을 변경하면 얼굴 인식 시스템이 다른 인물로 오인하는 것으로 나타났는데, 현란한 색의 종이로 만든 안경테를 걸치면 심지어 남성을 여성으로 잘못 인식하는 경우도 있었다고 함


얼굴 인식 시스템이 딥러닝 기법으로 얼굴의 특징을 파악한다고 하는데, 이 사례를 보면 눈매의 이미지를 판정에 사용하는 것으로 추정해 볼 수 있음


그러나 AI가 실제로 어떤 논리로 얼굴 인증을 하고 있는지는 아직 수수께끼이며, 이것이 규명되지 않는 한 얼굴 인증 시스템을 손쉽게 빠져 나가는 범죄자의 트릭을 막을 방법이 없음


AI의 작동 메커니즘이 알려지지 않는 이유는, AI의 기초를 이루는 신경망이 인간의 뇌를 본떴기 때문인데, 인간 뇌의 정보 저장 방식이 아직 밝혀지지 않았기 때문


AI의 신경망(Neural Network)으로 이미지를 판정할 때는 사진과 태그를 네트워크에 입력한 후 출력이 제대로 사진의 내용을 판정할 수 있도록 훈련시키는 과정을 거침


• 훈련 과정에서는 네트워크의 각층 사이의 연결 강도(Weight)를 조정하는데, 이러한 교육 과정은 인간의 뇌가 학습 할 때 뉴런의 연결 강도를 조정하는 움직임과 유사한 것으로 알려져 있음


학습에서 얻은 연결 강도는 각 뉴런(그림 4의 흰색 동그라미 부분)에 저장되는데, 따라서 신경망을 훈련시키는 메커니즘의 특징은 프로그램과 데이터를 한 곳에 모아 저장하지 않고 학습 데이터를 네트워크에 분산하여 저장할 수 있다는 것임


<자료> Neural networks and deep learning.


[그림 4] 인공지능 신경망의 정보 저장 구조


인간의 뇌도 동일한 방식으로 작동하는데, 가령 뇌가 전화번호를 기억할 때, 첫 번째 숫자는 다수의 시냅스에 흩어져 저장되며, 두 번째 숫자도 마찬가지로 흩어져 저장되지만 첫 번째 숫자와 가까운 위치에 저장되는 것으로 알려져 있음


문제는 뇌의 이런 저장 메커니즘이 아직 정확히 밝혀지지 않았고, 따라서 뇌의 구조를 본 뜬 신경망의 정보 저장 메커니즘의 규명이 진행되지 못하고 있다는 점


딥러닝의 문제점은 응축하자면 지식이 네트워크 상에 눌어붙어 있다는 점에서 기인하는데, 즉 지식이 수천만 개에 이르는 뉴런에 흩어져 저장되기 때문에 시스템을 개발한 인간이 아니라 네트워크가 지식을 습득한다는 데 문제의 본질이 있음


AI만이 알고 있는 답을 규명하기 위해 1990년대 초부터 연구자들이 AI의 블랙박스를 열려는 시도를 해왔는데, 규명의 과정이 곧 AI에 대한 의구심이 높아지는 과정이었음


카네기 멜론 대학은 1990년대부터 자동운전 기술의 기초 연구를 진행하고 있었는데, 당시 연구원 딘 포모루는 카메라에 포착된 영상으로 자동운전 알고리즘을 교육시켰음


몇 분간 알고리즘을 교육한 후 차량을 자동 주행시키는 시험을 반복했는데, 시험은 잘 진행되었지만 다리에 접근할 때 자동차는 도로에서 벗어나는 움직임을 보였고, 그러나 알고리즘이 블랙박스여서 그 원인을 알 수 없었음


소프트웨어를 디버깅하는 방법으로는 로직을 수정할 수 없기 때문에 포모루는 도로 도로주행 시험을 반복하며, 다양한 상황에서 자동운전을 반복하며 경험적으로 문제점을 밝혀낼 수밖에 없었음


그에 따르면 자동차는 갓길 바깥에 나있는 잔디 부분을 기준으로 주행 도로를 판정하고 있는 것으로 파악되며, 다리에 가까워지면 잔디 부분이 없어져 차로 판단 기준을 잃게 되므로 정상적인 주행을 할 수 없게 된 것임


이런 결론에 이르게 되자 포모루는 자동운전 기술을 AI로 구현한 자동차가 과연 제대로 작동할 것인지 확신할 수 없게 되었다고 함


◈ 현재에도 이와 동일한 문제에 직면하고 있는데, 무인 자율운전 차량들이 도로를 달리고 있는 지금, 사람이 AI 기술을 신뢰해야 할 지의 문제가 최대 이슈가 되고 있음


AI의 운전 로직을 모르기 가운데, 어떻게든 안전 기준을 만들려다 보니 시행착오가 계속되고 있는데, 그 중 하나는 정해진 거리를 무사고로 주행 가능하다면 안전한 것으로 간주한다는 생각임


싱크탱크 랜드 코프(Rand Corp)는 인간이 자동차를 1억 마일 운전할 때 사망 사고는 1.09 회 발생하는데, 자율운전 차량이 인간만큼 안전하다는 것을 증명하기 위해서는 2.75억 마일을 무사고로 달릴 필요가 있다는 기준안을 제시한 바 있음


인간 수준의 안전성을 입증하기 위해서는 대규모 주행 시험이 필요하다는 말인데, 이는 자율운전 자동차의 안전 기준을 설정하는 작업이 난항을 겪고 있음을 잘 보여줌


◈ 그러나 자율주행 차량의 도입과 확산을 위해서는 결국 AI의 작동 메커니즘 규명이 반드시 전제되어야 할 것이므로, 이 문제를 기술적으로 해명하려는 움직임도 시작되었음


엔비디아(Nvidia)는 딥러닝을 이용한 자율운전 기술을 개발하고 있는데, 이 시스템의 명칭은 데이브-2(DAVE-2)이며 신경망으로 구성되어 있음


인간이 알고리즘에 주행 규칙을 가르치는 것이 아니라, 시스템이 신경망에서 이미지를 처리하여 안전한 경로를 파악하는데, 가령 곡선 도로의 이미지를 읽으면서 거기에서 운전할 때 알아야 할 필요가 있는 도로의 특징을 파악함


엔비디아는 AI가 어떤 기준으로 결정하고 있는지에 관한 연구를 함께 진행하고 있는데, 지금까지 블랙박스였던 AI의 핵심을 규명하는 시도임


• 연구의 결과, 엔비디아는 카메라가 포착한 사진과 이미지 인식 신경망(CNN)이 이것을 읽고 거기에서 추출한 특징을 비교해서 보여주며, AI가 도로를 어떻게 이해하고 있는지를 설명하고 있음


신경망이 보여 주는 굽은 도로의 특징을 보면, 특징량은 곡선이 대부분으로 CNN이 도로의 경계 부분을 기준으로 운전하고 있음을 알 수 있는데, 이런 방법을 통해 AI가 습득한 운전 기술의 요체를 사람이 시각적으로 이해할 수 있다는 설명



<자료>Nvidia.


[그림 5] AI가 도로를 인지하는 방법



2016년이 인공지능의 가능성을 열어젖힌 원년이라면, 2017년은 AI의 블랙박스를 열어 그 작동 논리를 규명함으로써 AI 확산의 기폭제를 마련하는 해가 될 것으로 예상


자율운전 자동차를 포함 자율적 인공지능 시스템은 심층강화학습(Deep Reinforcement Learning)이라는 기법을 사용하여 알고리즘이 시행착오를 반복하여 정책을 학습하도록 하고 있음


심층강화학습 기법은 알파고에도 사용되고 있으며, 보다 지능적인 AI 개발의 핵심 기법이 될 것으로 보이는데, 현재 심층강화학습의 요체도 블랙박스이지만, 앞으로 이에 대한 규명 작업도 적극 진행될 것으로 예상됨


무언가 새롭고 획기적인 것인 등장했을 때, 그것의 요체와 작동 방식을 정확히 모른다면 사람들의 대응 방식은 무조건적인 거부 혹은 반대로 종교와 유사한 무조건적 추종과 같은 극단적 양상을 띨 위험이 있음


인공지능이 사회적 합의 위에 다양한 가치를 위해 활용되려면, 그 메커니즘에 대한 정확한 이해가 수반되어야 할 것이며, AI가 인간의 뇌를 본 뜬 것인 만큼, AI를 알아가는 과정은 곧 우리 인간이 스스로에 대해 더 많이 알게 되는 과정이 될 수 있을 것임

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1777호(2016. 12. 21 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

인공지능 이용 기사 진위 판정.pdf



[ 요 약 ]


이번 미국 대통령 선거에서는 가짜 뉴스가 난무하여 유권자들이 적지 않은 영향을 받았다는 점이 문제로 제기되었음뉴스의 제목이 충격적이고 기사의 주장에 의구심을 가질 만한 소지도 많았음에도가짜 뉴스는 페이스북을 통해 확산되며 실질적인 영향력을 끼쳤음이런 문제를 해결하기 위해 인공지능을 이용해 가짜 뉴스를 판정하려는 시도가 이루어지고 있으며그 동안 유보적 입장을 취해왔던 페이스북도 AI를 이용해 적극 대응에 나설 것으로 전망




[ 본 문 ]


◈ 페이스북에 표시되는 뉴스에 허위 정보가 포함되어 있다는 사실은 선거가 시작되기 훨씬 전부터 문제로 지적되어 왔으나 트럼프 당선 이후 단숨에 정치 문제로 비화


문제를 제기하는 사람들은 페이스북 측이 트럼프에 유리한 허위 뉴스를 뉴스피드에 게재한 뒤, 입소문 효과를 통해 트럼프 지지자가 늘었다고 주장함


실제로 대선에서는 자극적인 제목으로 눈길을 끈 거짓 뉴스들이 난무했는데, 일례로 WTOE 5 News라는 사이트는 교황이 트럼프를 대통령으로 지지한다는 거짓 기사를 올렸는데, 팩트 체크 사이트는 이 기사가 거짓으로 주의를 환기시킨 허위라고 판정


또한 National Report라는 사이트는 힐러리가 미국의 국가(國歌)를 재검토 할 것을 제안했다는 기사를 게재했는데, 내용은 힐러리가 가사 내용이 권총 등에 의한 폭력으로 이어질 우려가 있고, 종교와 국가의 분리 원칙에 저촉되기 때문에 반대한다는 것


페이스북의 CEO 마크 저커버그는 이런 허위 뉴스가 승패에 영향을 미쳤다는 분석에 대해서는 여전히 부정하고 있지만 가짜 뉴스를 억제하는 대책을 취할 것임을 밝혔음


◈ 가짜 뉴스에 속아 넘어가는 사람이 얼마나 되겠냐는 반론도 있지만, 사람들이 기사를 읽으며 이상하다고 느끼기는 하지만 실제로 허위라고 판단하는 것은 쉽지 않다는 지적


뉴스 사이트의 이름이나 외관, URL은 진짜처럼 보이고, 이미 자극적인 제목의 기사들이 많기 때문에 기사의 제목을 보고 허위 기사라고 단박에 알아차리기는 어려움


기사를 일단 읽기 시작하면 공감이 가는 부분도 있기 때문에 끝까지 읽게 되고, 비록 군데군데 위화감을 느끼기는 하지만 기사가 허위임을 간파하지는 못하며 오히려 흥미로운 내용에 관심을 갖게 된다는 것


앞서 예로 든 National Report는 이름만 보면 권위 있는 뉴스 사이트처럼 보이나 기실 이 사이트는 허위 뉴스만 게재하고 있으며, ABCNewsc.com.co처럼 순간 착각을 불러일으키도록 대놓고 굴지의 언론을 사칭하는 경우도 있음


이들 사이트의 목적은 매력적인 허위 뉴스를 통해 페이지 뷰를 발생시켜 웹사이트에 게재되는 광고로 수익을 얻는 것이며, 페이지 뷰가 높은 뉴스의 경우 한 건으로 약 1만 달러의 광고 수입이 발생하는 것으로 알려지고 있음




<자료> WTOE 5 News, National Report


[그림 1] 최악의 가짜 뉴스로 꼽힌 교황의 도널드 트럼프 지지 뉴스(위)


• 허위 뉴스 문제가 불거진 후 현재 구글은 허위 뉴스 사이트에 광고 게재를 중지하고 있으며, National Report 웹사이트의 광고 수입은 급감했다고 함


National Report 같은 사이트는 허위 뉴스를 발신해 왔으나 회사 자체의 사회적 영향력은 제한적일 수밖에 없었는데, 페이스북 같은 SNS와 접목되면서 영향력이 증폭되었음


페이스북 등 소셜 미디어에 기사가 노출되고 좋아하는 사람이 늘어나 기사의 링크가 공유되기 시작하면 이런 허위 기사들의 노출 빈도가 폭발적으로 늘어나게 됨


페이스북은 인기 기사를 트렌딩(Trending)으로 묶어 제공하고 있는데, 여기에 가짜 뉴스가 게재되면 전국적인 규모로 확산이 가능해지며, SNS의 소셜 기능을 악용하는 이런 과정이 가짜 뉴스가 여론을 움직일 수 있는 기반이 되고 있음


가짜 뉴스는 읽는 사람들에게만 영향을 미치는데 그치지 않고, 대통령 선거운동 과정에서 트럼프 진영이 허위 뉴스를 인용해 힐러리 후보를 공격하는 장면까지 나왔음



<자료> Eric Trump.


[그림 2] 선거운동에 사용된 가짜 뉴스 사례


• 도널드 트럼프의 아들인 에릭 트럼프는 가짜 뉴스라 생각되던 기사의 내용을 근거로 논쟁을 벌였는데, 트윗을 통해 트럼프 연설회장에서 반대 운동을 하는 활동가들은 힐러리 진영에서 3,500 달러를 받고 있다는 내용의 기사를 인용했음


그러나 인용된 기사는 사실이 아니었으며, 해당 트윗은 삭제되었지만 복사본이 지금도 많은 사이트에 게재되어 있으며, 선거의 당사자들도 가짜 뉴스를 분간하는 데 오랜 시간이 걸려 영향력은 오래 시간 동안 지속되었음


◈ 페이스북이 대선 과정에서 허위 뉴스 논란에 대해 일단 부정하는 태도를 보이긴 했지만 실제로는 일찍부터 소위 가짜 뉴스(Hoaxes)에 대한 대책을 취하고 있었음


2015 1월에는 페이스북 회원들이 가짜 뉴스를 보고 신고할 수 있는 시스템을 도입했는데, 이는 스팸 메일을 신고하면서 뉴스피드에 노출된 뉴스가 사실이 아닌 경우 그 주요 내용을 신고할 수 있도록 하고 있음


회원들의 신고를 통해 가짜 뉴스가 뉴스피드에 표시되는 횟수가 감소했다고 하는데, 크라우드 소싱 기법을 이용해 대응책을 시작한 것임


◈ 페이스북은 2016 8월부터는 뉴스피드에 클릭베이트(Clickbait) 기사를 삭제하는 대책을 내놓았는데, 클릭베이트는 우리 말로는 클릭을 유도하는 낚시 기사를 뜻함


믿을 수 없는 사실, 어젯밤 레드 카펫 위에서 연예인끼리 싸움, 누구일까..라고 제목을 달면 궁금해 하는 사람들이 링크를 클릭해 자세히 읽게 되는데, 이는 사이트로 유도하는 상투적인 수법이지만 여전히 통하는 수법이기도 함


페이스북 이용자들에게 클릭베이트는 여전히 인기가 많지만, 페이스북은 클릭베이트 기사들이 뉴스피드에 노출되는 횟수를 억제하고 있음


클릭베이트에는 독자를 오도하는 기사도 포함되므로 이를 억제하면 가짜 뉴스를 방지하는 기능도 하게 되는데, 페이스북은 클릭베이트 기사 대응을 위한 알고리즘을 개발하고 탐지 프로세스를 자동화하였음


페이스북은 특정 사이트로 유도하는 기사나 오보의 제목 사례를 모아 클릭베이트 데이터 세트를 작성했으며, 이 사례를 기준으로 일반 뉴스들의 제목과 비교해 클릭베이트에 특유한 징후를 식별하고 있음


또한 클릭베이트를 검출하는 알고리즘을 개발해 이를 기계학습 방법으로 교육시킴으로써 검출 정밀도를 높여 가는데, 이는 스팸을 검출하는 방식과 유사하며 뉴스피드에서 허위 뉴스를 배제할 수 있을 것으로 기대를 받아 왔음


페이스북이 이러한 조치를 취하고 있음에도 불구하고 가짜 뉴스는 계속 증가했으며 대선에서 유권자에게 혼란을 초래하게 되었음


◈ 페이스북이 개발한 알고리즘은 뉴스의 제목을 기준으로 허위 여부를 판정하기 때문에 기능이 충분하다고 말할 수 없으며, 사실 관계의 확인이 필요한 경우 더욱 한계가 존재


사실 기사의 허위 여부를 판정하는 것은 사람에게도 어려운 일이며, 명백한 거짓은 판정하기 쉽지만, 내용을 파악하고 사실 관계의 검증이 요구되는 기사들이 대부분임


허위 뉴스라도 황당한 내용만 있는 것이 아니며, 해킹 수법 중 소셜 엔지니어링 기법처럼, 당시 맥락에 맞게 작성되는 것들은 그럴 듯하다고 여겨지기 때문에 내용을 읽고 나서도 판단하기 어려운 경우도 있음


<자료> ABCNews.com.co.


[그림 3] 시의성의 빠른 가짜 뉴스


• 일례로 거짓 뉴스로 판명되었지만, 선거 직후 트럼프의 당선이 결정된 직후 오바마 대통령이 대통령령을 발동해 선거 결과를 검증한다는 기사가 발행되었는데, 이처럼 대부분의 경우 뉴스 기사를 읽은 것만으로는 진실 여부를 판단하는 것이 어려움


우선 기사에서 언급된 주장을 뒷받침하는 사실을 확인하는 작업이 필요하기 때문에, 주장의 출처를 찾고 사실 관계를 확인해야 함


또한 주장을 뒷받침하는 사실이 확인되었다고 해도, 기사에서 사실을 과장하거나 확대 해석하는 경우가 적지 않은데, 기사 검증은 이러한 단계를 모두 거치고 나서야 내용이 올바른지 판정을 내릴 수 있음


기사 검증은 진위를 판정하는 것이 목적이지만 판정할 수 없는 경우도 많이 있는데, 가령 트럼프가 대통령에 선출된 데 대해 트럼프에 반대하는 사람들을 중심으로 #NotMyPresident를 표방한 항의 시위가 미국 각지에서 발생하였음


이에 관한 기사 중에는 시위대는 사실 투표소에 가지 않았고, 힐러리에게 투표하지도 않았다고 쓴 것도 있는데, 이에 대한 사실 관계는 확인하기가 어려워 기사의 진위를 판명할 수 없으며, 진실을 밝혀 내기에 현실적으로 한계가 존재함


◈ 이 문제 해결을 위해 많은 곳에서 방법을 제안하고 있는데, 화이트 해커들이 인공지능(AI)을 이용해 페이스북에 게재된 기사의 진위를 판정하는 기법을 개발


프린스턴 대학에서 열린 해커톤 행사 기간 중에 4명의 대학생들은 36시간 만에 가짜 뉴스를 판정해내는 AI 기반 소프트웨어를 개발하였음


이들이 개발한 소프트웨어 FiB는 브라우저의 플러그인으로 설치되며, 페이스북의 기사를 읽고 그 내용을 판별하는데, 기사가 허위라고 판단되면 검증되지 않음(Not Verified), 사실이라 판단되면 검증됨(Verified)이라고 표시함


<자료>FiB Project.


[그림 4] AI 기반 가짜 뉴스 판정시스템 FiB


• 일례로 대마초가 암 세포를 파괴한다는 기사에 대해서는 분석 후 사실이 아니라는 판단 하에 Not Verified라 표시하였음


FiB AI를 이용하여 기사에 게재되어 있는 사진을 인식하여 이를 텍스트로 변환하고, 또한 기사에서 키워드를 추출한 다음 검색 엔진에서 그 내용의 출처를 조사한 후 사실 여부를 확인한다고 함


가령 트위터에 게재된 내용이라면 스크린샷이 게재되어 있는 경우 트위터에 해당 내용이 있는지 검색하여 그 출처의 진위를 확인함


대학생들은 공개된 AI 클라우드의 API를 최대한 활용하여 시스템을 만들었다고 하는데, 마이크로소프트 인지 서비스(Microsoft Cognitive Services), 트위터 검색 API(Twitter Search API), 구글 안전 브라우징 API(Google Safe Browsing API) 등이 사용되었음


기사 판정의 정확성 검증은 앞으로 해나가야 하겠지만, 세계 최첨단 AI 기술을 보유한 페이스북 보다 먼저 솔루션을 개발한 것은 주목할 만함


◈ 알고리즘 개발과는 별도로 많은 단체들이 수작업을 통해 기사의 진위를 판정하고 있는데, 이들 팩트 체크 사이트들은 가짜 뉴스에 현혹되지 않도록 주의를 환기시키고 있음


<자료>FactCheck.org.


[그림 5] 팩트 체크 사이트 FactCheck.org


FactCheck.org는 대표적인 팩트 체크 사이트로 펜실베이니아 대학의 연구 기관으로서 활동을 시작한 독립적 비영리단체로, 원래 정치 문제에 관한 정치인 주장의 진위를 자세히 확인하며 사실 관계를 바로 잡아주는 역할을 해왔음


가령 미국 하원의장 폴 라이언이 미국의 의료제도인 메디케어(Medicare)가 오바마케어에 의해 파탄되었다고 주장한 것에 대해, 사실 확인 결과 잘못된 주장임을 설명


FactCheck.org는 대선 기간 중에는 유권자들이 가짜 기사나 허위 사실 유포에 현혹되지 않도록 독자들에게 가짜 뉴스 분별 방법 등을 알려주는 역할도 하였음


1995년에 설립된 인기 팩트 체크 사이트인 Snopes.com은 이메일이나 포럼을 대상으로 기사의 진위를 판정하는 목적으로 설립되었음


대통령 선거 과정에서는 정치 뉴스에 초점을 맞추고 문제점을 지적하며 유권자들의 주의를 환기시켰는데, 알기 쉬운 표현으로 많은 사람들에게 이용되고 있고, 정치 문제뿐만 아니라 비즈니스, 엔터테인먼트, 건강, 종교, 기술 등 폭 넓은 분야를 커버함


◈ 미국 대통령 선거는 끝이 났지만, 가짜 뉴스는 선거 전부터 시작되었고 선거 과정을 통해 그 실제 영향력이 확인되었기에 앞으로도 계속 이어질 것으로 예상되고 있음


미국에서 민간인에게 수여하는 최고 훈장인 대통령 자유의 메달(Presidential Medal of Freedom) 수여식이 선거 직후인 11 22일 백악관에서 거행되었으며, 영화 배우 로버트 드 니로 등에게 오바마 대통령이 메달을 걸어주었음


이 날 클린트 이스트우드의 것으로 보이는 트위터 계정에 오바마는 나의 대통령이 아니므로 그가 주는 어떤 메달도 받지 않겠다는 내용의 트윗이 올라왔고, 트위터 상에서 리트윗 되었으며, 이런 내용을 다룬 가짜 뉴스들이 나돌기 시작했음


<자료>Snopes.com.


[그림 6] 클린트 이스트우드를 사칭한 트윗


• 그러나 최초 트윗은 이스트우드인 것처럼 보이게 @ClintEastwoodLA라는 계정을 쓰고 프로필에 이스트우드의 사진을 사용한 사람이 발신한 것이었으며 곧 사실이 아닌 것으로 판명되었음


그럼에도 이스트우드가 트럼프 지지자이기 때문인지 이 트윗은 소셜 미디어 상에서 계속 리트윗 되고, 이를 소재로 작성된 뉴스들이 SNS 상에 계속 흘러 다니고 있음


최초의 트윗과 가짜 뉴스 사이의 연관성은 아직 밝혀지지 않았지만, 만약 치밀하게 계획된 것이라면, 이는 앞으로 가짜 뉴스 생성이 보다 교묘해질 것이고, 사실 관계를 파악하기가 점점 더 어려워지게 될 것임을 시사


◈ 페이스북은 자신들이 미디어 기업이 아니라는 입장을 강조해 왔으나, 현실적으로 페이스북은 가장 강력한 뉴스 소비 매체이므로 보다 적극적인 대책 마련이 필요한 시점



• 퓨 리서치(Pew Research)에 따르면 소셜 미디어가 일상이 되면서 뉴스를 읽는 방법이 크게 바뀌어 미국 성인의 62%가 소셜 미디어에서 뉴스를 읽고 있음


특히 페이스북을 통해 미국 성인의 44%가 뉴스를 읽는 것으로 나타나 유튜브나 트위터에 비해 뉴스 전달 매체로서 페이스북은 절대적인 위치를 차지하고 있음



<자료>Pew Research.


[그림 7]  SNS 이용자 중 뉴스 이용 빈도


마크 저커버그는 그 동안 페이스북은 미디어 기업이 아니어서 기사의 진위를 자체적으로 결정할 수 없다는 입장을 취해왔으며, 기사 진위 판단은 독자에게 맡겨졌음


하지만 페이스북이 미국 최대의 뉴스 전달 기업이 되었다는 사실을 감안하면, 배치하는 뉴스의 품질에 페이스북이 책임을 져야 한다는 목소리가 점차 힘을 얻고 있음


마찬가지로 구글이나 트위터에 대해서도 가짜 뉴스 대책 마련을 강하게 요구되고 있으며, 구글은 이미 가짜 뉴스 사이트에 광고 게재를 중단하였음


가짜 뉴스가 전 사회적 문제가 되면서 페이스북 내에서 문제 의식을 가진 직원들이 모여 자발적으로 문제 해결을 위해 움직이기 시작했다는 소식도 전해지고 있으며, 저커버그도 그 동안의 입장을 바꾸어 적극적인 대책 마련에 나선다고 밝혔


최근 페이스북은 가짜 뉴스를 자동으로 삭제하는 도구에 대해 특허를 출원하였으며, 아마도 AI를 활용한 솔루션이 개발되었을 지도 모르며, 구글이 이메일에서 스팸을 필터링 하는 것처럼 조만간 뉴스피드에서 가짜 뉴스도 상당수 걸러지게 될 것으로 기대


AI로 작성되는 기사의 유형과 수가 늘어나고 있는 상황에서, 허위로 작성된 기사의 진위 여부를 판정하는 역할도 AI에 맡겨지게 되고, AI 개인비서가 뉴스를 선택해 들려 주는 시대가 되면, 뉴스 산업은 AI 기반으로 재편되는 대표적 사례가 될 전망

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1773호(2016. 11. 23 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

기업의 디지털 마케팅 툴로 부상하는 채팅봇.pdf



[ 요 약 ]


2000년대 초반 이후 인공지능 채팅 로봇 개발 시도는 간헐적으로 전개되어 왔으나 눈에 띄는 흐름을 만들어 내지 못하다가, 올해 4월 페이스북 메신저의 채팅봇 지원 발표 이후 관련 논의가 급물살을 타고 있음. 채팅봇은 새로운 전자상거래 플랫폼이 될 것이라는 전망이 나올 만큼 무궁한 잠재력을 지니고 있으므로, 기업의 마케팅 담당자는 채팅봇 기술을 제대로 활용하기 위해 기술에 대해 정확히 이해하고 기업 IT 부서와 긴밀하게 공동 대응해 나갈 필요가 있음



[ 본 문 ]


2016년 초반까지만 해도 채팅봇은 IT 업계에서 거의 주목받지 못했으나, 4월에 개최된 페이스북 개발자 컨퍼런스 이후 관련 논의가 급물살을 타고 있음


메신저 상에서 사람들과 대화를 나눌 수 있는 인공지능 개발은 오래 전부터 시작되었으며, 2002년 마이크로소프트(MS) MSN 메신저 상에 네트워크 에이전트를 선보인 것이 다수의 소비자를 대상으로 한 첫번째 채팅봇 구현 시도였음


그러나 MSN의 높은 인기에도 불구 에이전트 서비스는 유의미한 반향을 불러 일으키는 데 실패하였으며, 이후 채팅봇은 성인사이트 등에서 일부 고객지원 기능의 대체제로 활용되기는 했으나, 대중적인 서비스로 자리잡지는 못했음


올해 초반까지만 하더라도 상황은 비슷했으나, 최근 급속한 기술발전 양상을 보인 인공지능이 이슈로 급부상하기 시작했고, 4월에 열린 페이스북 개발자 컨퍼런스 F8에서 메신저 플랫폼과 채팅봇에 대한 발표가 이루어지면서 상황이 변하기 시작


F8 이후 MS, 구글, 아마존 등도 인공지능 기반의 대화형 서비스를 발표했고, 메신저 상의 채팅봇은 차세대 전자상거래 플랫폼으로 거론되며, 채팅봇은 일순 IT 업계의 다음 물결(next wave)로 자리매김 되고 있음


Kik(), LINE(라인), Telegram(텔리그램) 등 메시징 플랫폼에서도 자신들이 개발한 채팅봇의 실험을 진행하고 있으며, 지난 9월 말 텍사스 오스틴에서는 채팅봇 관련 컨퍼런스인 'Talkabot(토커봇)'이 개최되기도 하였음


◈ 메신저 플랫폼에서 채팅봇이 차세대 상거래를 주도할 것이라는 전망이 나오는 만큼 기업의 마케팅 담당자들은 채팅 로봇의 현재와 미래에 대해 정확히 이해할 필요가 있음


구글 어시스턴트나 아마존 에코에서 확인이 되듯, 인공지능이 사용자와 대화하며 요구사항을 수행하는 기술은 이미 궤도에 들어서고 있음


• 채팅 로봇이 차세대 전자상거래 플랫폼이 된다는 의미는 사용자의 취향을 학습한 가상 비서와 각 기업의 상품과 서비스를 판매할 수 있는 인공지능 채팅봇들간의 상호작용을 통해 상거래가 이루어지는 시대가 도래한다는 것


<자료> IITP.


[그림 1] 메신저 플랫폼과 채팅봇


기업 입장에서는 소비자의 요구사항을 잘 이해하고, 올바르게 대응하여 기업의 상품과 서비스를 판매할 수 있는 인공지능 채팅봇의 운영이 중요해지며, 디지털 마케팅과 영업의 최전선에 채팅봇이 자리잡게 됨을 의미


검색엔진, 유튜브, SNS 등 기술 트렌드에 따라 기업의 디지털 마케팅 도구도 변화하고 있는데, 다음 번 디지털 마케팅의 핵심 트렌드는 채팅봇이 될 것이란 전망인 것임


따라서 기업의 마케팅 담당자는 채팅봇 기술의 현재와 미래, 실제로 마케팅 효과가 있을 지에 대한 판단, 채팅봇을 운영하기 위해 필요한 자원과 전사적 협력 체계, 운영 시 유의사항은 무엇인지에 대해 정확히 이해할 필요가 있음


◈ 기업의 마케팅 담당자들이 채팅봇에 대해 알아야 할 항목은 크게 7가지인데, 우선 채팅봇이 무엇인지 정확히 이해해는 것으로부터 출발해야 함


채팅봇 전문 사이트 챗봇 매거진(ChatbotsMagazine.co)은 채팅봇에 대해, 인간이 채팅 인터페이스를 통해 접촉하는 서비스로 규칙에 따라 작동되며, 때로 인공지능(AI)이 사용되는 경우도 있음이라 정의하고 있음


챗봇 매거진에 따르면 현존하는 채팅봇은 크게 두 가지로 나누어 볼 수 있는데, 첫번째는 기업들이 사업의 목적에 맞게 제공하는 채팅 로봇으로 일반적인 메시징 앱에서 사용할 수 있음


예를 들어 페이스북 메신저 앱에서 사용할 수 있는 CNN의 뉴스 채팅봇이나, 꽃 배달업체 1-800-Flowers의 선물용 꽃꽂이 상품 선택과 배송을 지원하는 채팅봇이 대표적


두 번째 유형은 챗봇 플랫폼으로 애플의 시리(Siri), 구글의 구글 어시스턴트(Google Assistant), 아마존의 알렉사(Alexa), MS의 코타나(Cortana) 같은 가상 비서가 해당함


채팅 로봇 플랫폼은 특정 기업과 소비자의 접촉을 지원한다기 보다 다종다양한 정보 및 다른 수요와 관련해 이용자들을 지원하는 기능을 함


◈ 마케팅 담당자들이 알아야 할 두 번째 항목은 활용 범위로, 현 단계에서 채팅봇은 전자상거래, 고객 서비스, 여행, 불면증 완화 등에 이용되고 있음


• 웹사이트 봇리스트(Botlist)는 채팅봇을 플랫폼과 카테고리별로 소개하고 있는데, 메시징 앱의 채팅봇은 기본적인 커뮤니케이션 기능, 전자상거래 기능, 여행계획 수립 등을 제공함


<자료> botlist.


[그림 2] 채팅봇 검색 사이트 봇리스트


현재 채팅봇은 특히 기업들이 상거래를 촉진할 목적으로 널리 사용하고 있으며, 젊은층을 주요 타깃으로 해 이용자의 구매 욕구를 불러일으키고, 구매할 상품의 수를 늘리는데 초점을 두고 있음


채팅봇은 대고객 서비스 부서나 영업 담당자의 업무 부담 경감 효과를 가져올 수도 있지만, 더 큰 가능성을 내포하고 있는 것은 개인화(personalize)와 참여(engagement)


가령 아마존 인공지능 스피커 에코(Echo)의 경우 대화형 상거래라는 새로운 물결을 만들어 냈으며, 이용자는 자신이 필요로 하는 것을 요청하는 것 만으로 간단히 주문과 배송이 이루어질 수 있게 하였음


침대 매트리스 생산 및 판매 사업을 하는 스타트업 캐스퍼(Casper)가 불면증 환자들을 위해 제공하는 채팅봇인 인섬노봇-3000(Insomnobot-3000)도 인구에 회자되고 있는데, 이 채팅봇은 밤 11시부터 새벽 5시 사이에만 이용할 수 있음


캐스퍼의 채팅봇은 수면 혹은 수면 부족과 관련한 모든 것을 가지고 있기 때문에, 캐스퍼의 브랜드를 강화해 주며 채팅봇 이용 마케팅의 성공사례로 꼽히고 있음


캐스퍼는 이용자들을 속여 실제 인간과 대화하고 있다고 믿게 만들려는 시도를 하고 있지 않으며, 이용자들이 인기 프로그램의 재방송, 한밤중의 간식, 자주 거론되는 화제에 대해 채팅봇과 즐거운 대화를 갖도록 하는 데 초점을 두고 있음


[1] 인기를 모으고 있는 주요 채팅봇 리스트

채팅봇

주요 기능

우버

배차 의뢰

맥켈란(Macallan)/앱솔루트

신규 고객에게 적합한 위스키를 찾도록 안내해 주는 개인화 서비스

버버리

2016 9 London Fashion Week 기간 중에 자사 패션 쇼케이스

타코 벨(Taco Bell) / 도미노

음식 주문

하이 판초(Hi Poncho)

고양이 캐릭터가 일기 예보를 전달하는 메신저 앱의 인기 채팅봇

헬로보우트(HelloVote)

투표 이벤트 등록 지원

아이슬란드 에어

항공 일정 검색 및 예약

조지 타케이(George Takei)

스타트렉 TV 시리즈에서 Hikaru Sulu 역을 맡은 타케이의 개인 채팅봇.

<자료> CIO, 2016. 10, IITP 재정리


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 세 번째 항목은, 채팅봇은 갑자기 나온 기술이 아니라 수년 동안 이미 이용해 오고 있던 기술을 업그레이드한 것이라는 점


예를 들어, 항공사, 은행, 보험회사 등에 전화를 걸면 자동응답시스템이 먼저 전화를 받을 경우가 많은데 이러한 자동응답시스템 역시 로봇의 일종임


이런 유형의 시스템들은 소비자가 어떤 선택을 하도록 촉진함으로써, 이용자가 원하는 정보를 쉽게 제공하는 것을 목적으로 함


자동응답을 통한 접촉은 보통 고객경험의 향상에 연결되지는 않는 단점이 있는데, 왜냐하면 이용자가 여러 단계를 거쳐 특정 창구에 도달하더라도 결국은 보류 상태에서 기다리게 되거나 전화가 자동으로 끊어지는 일이 빈번하기 때문


이에 비해 메시징 앱과 채팅봇을 결합한 접촉은 시각적이며 반응이 빠른데, 이용자가 던진 질문에 대답이 되는 정보를 동영상이나 사진 등의 형태로 피드백 할 수 있음


이용자는 시간을 낭비하지 않아도 되고 전화가 끊길 걱정도 할 필요가 없어 채팅봇을 사용하는 편이 이용자의 참여 만족도를 훨씬 더 높여줄 잠재력이 있음


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 네 번째 항목은, 메시징 앱 전성시대는 채팅봇의 급성장도 추동할 것이므로, 채팅봇은 피할 수 없는 환경이 될 것이라는 점


모바일 앱 중에서 현재 메시징 앱이 특히 많이 사용되고 있기 때문에, 메시징 앱에서 사용할 수 있는 채팅 로봇 역시 인지도가 향상되고 있음


메시징 앱의 월간 액티브 이용자 수는 SNS 앱보다 많은데, 상위 4개 메시징 앱의 액티브 이용자 수는 월간 30억 명으로, SNS 앱의 이용자 수 5억 명에 비해 압도적


메시징 앱의 사용이 증가하고 있는 반면, 모바일 앱 전반적으로 보면 앱의 붐은 사라지고 있다고 말할 수 있는 현상들이 벌어지고 있는데, 가령 2016 5월말 기준 모바일 앱 상위 15개의 다운로드 수는 전년 동월 대비 평균 20% 감소하였음


• 시장조사기관 컴스코어(comScore)에 따르면 미국 스마트폰 사용자의 절반은 20162분기에 다운로드 한 앱의 수가 하나도 없었음



<자료>comScore.


[그림 3] 2016 2분기 미국 앱 다운로드 수


뉴욕 타임즈는 대기업들은 고객 서비스 용이성을 위해 자체 개발한 전용 앱을 제공하고 있으나, 이는 사람들을 피곤하게 하는 일이며 사용자들은 점차 개별적으로 앱을 다운로드 하는데 싫증 내고 있다고 지적하고 있음


이런 분석 역시 점차 앱의 시대가 저물어 가고, 채팅봇을 이용한 상거래 시대가 올 것이라는 전망과 궤를 같이 하는 것이며, 마케팅 담당자들이 놓치지 말아야 할 지점임


◈ 그러나 채팅봇은 아직까지는 초보적이고 시험적인 단계에 있다는 점도 간과하지 말아야 하며, 이 점이 마케팅 담당자가 채팅봇에 대해 알아야 할 다섯 번째 항목임


채팅봇이 중요한 고객 참여 도구가 될 수 있기는 하지만 현재 메시징 앱의 채팅봇은 아직 기술적으로 계발되지 않은 상태라 할 수 없음


애플이 앱스토어를 처음 개설한 2008년 무렵에 등장했던 초기 아이폰 앱들과 유사한 단계로 볼 수 있는데, 당시 방귀 소리를 내는 앱이 최고 인기 앱이었던 점을 상기하면, 현재 채팅봇 역시 소위 방귀 앱의 단계에 있는 것으로 볼 수 있음


채팅의 기초를 이루는 자연언어 처리와 기계학습 등의 기술은 아직 진화의 도중에 있으며, 미리 입력된 대화 레퍼토리에 의존하지 않고 인간과 로봇이 매끈하게 대화할 수 있는 경지까지 도달하려면 좀 더 시간이 필요할 것임


MS의 채팅봇 테이(Tay)가 사용자들이 의도적으로 잘못 학습시킨 것에 영향을 받아 인종차별적 발언을 쏟아 내며 서비스 시작 16시간 만에 MS가 사과문을 발표하고 서비스를 중단시킨 사건은 현단계 채팅봇의 수준을 잘 보여주는 사건이라 할 수 있음


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 여섯 번째 항목은 채팅봇에 상거래와 마케팅의 미래가 있기는 하지만, 채팅봇이 인간을 대체하는 것은 아니라는 점


채팅봇이 웹, 메일, 웹사이트, 또는 인간을 아예 대체하는 것은 아니며, 복잡하지 않은 쇼핑을 지원하고, 이용자가 원하는 정보를 신속하게 제공하는 등 특정 용도에 적합한 형태로 폭넓게 대규모로 도입되어갈 것으로 보임


그러한 용도로 사용한다고 하며, 채팅봇은 실제로 다른 방법으로 고객과 접촉하는 것보다 더 우수한 서비스 제공 수단이 될 수 있음


현재 실행 중인 채팅봇들은 약간은 눈속임 같은 것이며, 채팅봇의 화제성에 편승할 목적으로 급작스럽게 만들어 진 것이 대부분일 지도 모르나, 메시징 앱을 통해 기업과 11로 커뮤니케이션 한다는 개념만큼은 확실히 정착되어 가고 있음


◈ 마케팅 담당자가 채팅봇에 대해 알아야 할 마지막 항목은 채팅봇을 개발할 때 마케팅 담당자와 IT 부서와 처음부터 긴밀하게 협력하지 않으면 안 된다는 점


IT 부서와 협력해야 하는 가장 큰 이유는 최대한 보안성을 보장하기 위해 채팅봇의 통신을 암호화하고 암호화 된 채널에만 채팅봇을 도입하는 것이 필요하기 때문


기업 시스템 내에서만 작동하는 사내 봇이라면 독자적인 암호화 채널에 설치할 수도 있지만 메시징 앱과 같은 일반용 채널에 채팅봇을 도입하고 싶다면 채팅봇의 보안은 해당 플랫폼의 보안 기능에 완전히 좌우될 수밖에 없음


채팅봇에 숨어있는 보안 문제는 또 있는데, 채팅봇이 인간을 모방하는 능력이 높아지게 되면, 해커가 피싱 등 소셜 엔지니어링 기법으로 해킹을 시도할 때 채팅봇이 악용될 위험이 다분하다는 점


예를 들어, 고객 및 공급업체를 본뜬 채팅봇을 이용해 표적 회사의 직원 사이에 메시징 앱을 통한 대화를 시작하고, 의사 소통 관계가 확립된 시점에서 채팅봇이 직원을 부추겨 악성 링크를 클릭하거나 기밀 정보를 넘기게 할 수도 있음


◈ 채팅봇의 운영을 위해서는 상당한 자원의 소요가 요구되므로, 채팅봇의 성공적 운영을 위해서는 사실 IT 부서와의 협력뿐만 아니라 전사적 차원의 협력과 지원이 필요함


채팅봇 운영에는 상당한 지원이 필요한데, 대부부의 IT 부서는 채팅봇 개발자가 테스트 및 지원을 담당하지만 가동 후 채팅봇 지원을 위한 자원까지 있는 것은 아님


채팅봇은 일반적으로 고객 라이프 사이클 전반에 걸쳐 관련 활동을 하기 때문에 지원에 필요한 자원의 규모를 우습게 보면 안되며, 부서별로 업무가 단절된 기업에서는 사내 예산 배분과 귀속 문제에 직면하게 될 지도 모름


채팅봇 전문가들은 가치 있는 채팅봇을 개발하는데 있어 최대의 난관은 기반이 되는 기술 요소를 기업의 전사 시스템과 통합하는 일이라고 지적함


채팅봇의 실용성을 떠받치는 기둥이 되는 자연언어 처리와 예측 분석 기술은 대부분의 IT 부서에서 보유하고 있는 핵심역량이 아니므로, 통합 업무가 결코 간단치 않음


기업의 채팅봇은 CRM, 헬프 데스크, 주문처리 시스템 등 기업의 데이터 시스템과 직접 연계되어야 하며, IT 부서는 기술 아키텍처를 포괄적으로 파악하여 기업의 커뮤니케이션 아키텍처 전체가 채팅봇과 원활하게 연계할 수 있도록 해야 함


◈ 새로운 마케팅 도구의 활용 능력이 기업의 성과에 직결되고 있으므로, 디지털 마케터들은 자신들에 적합한 채팅봇 활용 전략의 수립과 실행에 역량을 모아나가야 할 전망


기업의 비즈니스 활동이 디지털 환경으로 옮아 감에 따라, 새로운 기술의 등장에 따라 부상하는 디지털 마케팅 기술들은 기업 성과에 상당한 영향을 미치고 있음


채팅봇은 아직 개발 중에 있는 기술이나 이미 시도되고 있는 기술이기도 하며, 검색엔진 마케팅과 SNS 마케팅이 그랬던 것처럼 어느 순간 갑자기 기업의 핵심적인 마케팅 채널로 급부상하여 기업의 성패에 영향을 미치게 될 가능성도 매우 높음


기업의 마케팅 역량과 자산을 어떤 방식으로 채팅봇에 학습시키고 사용자와 소통하게 할 것인지, 이를 위해 기업의 IT 부서 나아가 전사적 차원에서 어떤 협력관계를 구축할 것인지에 대한 전략 수립이 디지털 마케팅의 핵심 과제로 부상하고 있음

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1772호(2016. 11. 16 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

스탠퍼드대학_2030년_AI_전망.pdf



[ 요 약 ]


미국 스탠퍼드 대학은 2030년 인공지능과 생활(Artificial Intelligence and Life in 2030)이라는 제목의 보고서를 공개하였음. 이 보고서는 인공지능(AI) 그 자체와 함께 인간과 공동체 사회에 대한 AI의 영향에 대해 장기적 관점에서 조사하는 AI 100 프로젝트 중 첫번째 과업으로, 전형적인 미국의 도시를 예로 들어 교통, 가정용 및 서비스용 로봇 등 여덟 가지 분야에서 2030년경 AI 활용도를 예측한 것인데, AI가 미칠 영향이 광범위하므로 적극적 대응이 필요하다고 권고



[ 본 문 ]



◈ 스탠퍼드 대학은 2014년 가을 인공지능에 관한 100년 동안의 연구(One Hundred Year Study on Artificial Intelligence, 약칭 AI 100) 프로젝트를 시작하였음


AI 100 프로젝트의 첫번째는 전형적인 미국의 도시를 예로 삼아 운송, 로봇, 건강, 교육, 저자원 공동체, 공공의 안전과 보안, 고용과 직장, 엔터테인먼트 등 여덟 개 분야에서 2030년경의 AI 활용 상황에 대해 예측하고 것이었음


• 이 프로젝트에는 기업과 학계의 AI 전문가뿐 아니라 AI에 정통한 법률 전문가와 경제학자 등 17명의 멤버가 연구 패널로 참여하였음


패널 참여자 중에는 전 MIT 컴퓨터과학과 인공지능 연구소장이자 로봇 청소기 룸바를 만든 아이로봇의 설립자 로드니 브룩스와, 기계와의 경쟁이라는 책으로 널리 알려진 MIT의 에릭 브린욜프슨 등이 포함되어 있음


스탠퍼드 대학은 연구 패널들이 2015년에 논의한 결과를 바탕으로 2030년 인공지능과 생활(Artificial Intelligence and Life in 2030)이라는 제목의 보고서를 지난 9월에 발간하였는데, 약칭 <AI 100 보고서>라 불림


ai100_report_10032016_final_singles.pdf



AI 100 프로젝트는 적어도 100, 2114년까지 이어지는 매우 장기적인 것으로 연구 패널들은 5년마다 예측을 재검토

하게 된다고 하며, 따라서 AI 100 보고서 역시 5년마다 수정, 보완될 것으로 보임


AI 100 보고서는 지금으로부터 약 14년 후에 AI가 어디까지 진화하고 직장과 사회생활에 얼마나 침투할 것인지 나와 나의 주변을 이미지화하면서 읽을 수 있게 구성되어 있으며, AI의 역사와 현상에 대해서도 간결하게 정리되어 있음


AI 100 보고서의 전반적인 톤은 AI 확산의 부정적인 측면보다는 긍정적인 측면에 초점을 두라는 쪽에 가까우며, AI를 인간에 대한 즉각적인 위협으로 보지는 않음


보고서는 할리우드 영화에 종종 묘사되는 것 같은AI의 디스토피아적 이미지는 허구적(fictional)인 것이며, AI를 인간에 닥친 임박한 위협으로 경계할 하등의 이유가 없다고 단언하고 있음


지금부터 2030년까지 유용한 AI 응용프로그램이 늘어날 것이고, 이것들은 사회와 경제에 긍정적인 영향을 줄 것으로 연구 패널들은 예상하고 있음


운전이 더 안전해질 것이고, 아이들의 교육의 질이 향상되며, 사람들의 생활이 보다 윤택해질 것인데, 이런 긍정적인 면에 주목해야 한다고 이 보고서는 주장하고 있음


그러나 결코 미래를 장밋빛으로만 그리는 것은 아니어서, 고용 및 개인정보보호 등과 관련해 중요한 문화적·사회적 과제가 부상할 것이라는 점도 지적하고 있음


가령 AI가 인간의 노동을 어떤 식으로 확장하거나 대체하는 지에 따라서 혼란을 일으킬 수도 있고, 경제와 사회 전반에 영향을 미칠 문제가 생길 수 있다고 보고 있음


학술 종사자들이 프로젝트에 참여하고 있기 때문인지 전체적으로 예측에 대한 신중한 태도가 엿보이기도 하는데, 2030년에는 한마디로 이렇게 된다라는 식의 전망은 없으며, 이러저러한 조건이 충족되면 이렇게 될 가능성이 있다는 시나리오가 주를 이룸


명확하지 않다는 인상을 줄 수도 있으나, AI가 인간의 삶과 사회에 미치는 영향력의 크기뿐 아니라 영향의 범위가 얼마나 넓은 지를 엿볼 수 있는 시사점이 풍부함


◈ 보고서는 8개 분야 중에서 운송(Transportation)에 가장 많은 분량을 할애하고 있는데, 아마도 2030년경의 이미지를 그려보기가 가장 용이하기 때문인 것으로 보임


운송 분야에서 핵심은 당연히 자율운전인데, 보고서는 2030년경에 자율운전 기술의 적용 대상은 자동차에 한정되지 않고, 배송 차량과 트럭, 드론 같은 비행 기기나 개인용 로봇에 까지 확장될 것으로 예상함


자율운전 기술이 진화해 충분히 안전하고 인간의 운전 수준을 넘어서게 된다면 다양한 영향을 미치게 되는데, 보고서는 우선 교통 사고가 감소함으로써 자동차 사회인 미국에서 사고로 인한 사상자를 줄어 시민의 평균 수명이 연장될 것이라 예상


또한 라이프 스타일이 바뀌게 되는데, 미국에서 1회 운전 시간은 평균 25분으로, 운전을 AI에 맡기면 이 시간을 일이나 엔터테인먼트에 활용할 수 있게 됨


차내에서 시간을 편안하게 보낼 수 있게 되면 거주지에도 영향을 미칠 수 있는데, 근무지와 가까운 곳에 살지 않아도 상관 없다고 생각하는 사람이 늘어날 가능성이 생김


특히 자녀가 있는 가정, 노인, 장애를 가진 사람들이 보다 자유롭고 유연하게 사는 곳을 선택할 수 있게 될 것으로 예상해 볼 수 있음


◈ 자율운전 기술의 발전은 자동차 문화는 물론 전철이나 버스 등 대중교통에 대해서도 영향을 미치게 되어, 도시 및 공공 공간의 디자인에도 영향을 미칠 것으로 보임


자율운전과 함께 차량 공유가 보편화되면 자동차를 소유하지 않고 서비스로 간주하는 사람들이 늘어날 것이며, 이렇게 되면 주차 수요가 줄어들기 때문에 도시 및 공공 공간의 디자인에도 영향을 미칠 수 있음


• 전철이나 버스 등의 대중교통에 대한 영향도 불가피한데보고서는 자율운전의 보급으로 대중교통에 대한 수요는 감소할 것으로 전망하며개인 고속 환승(Personal Rapid Transit, PRT) 등으로 변모할 것이라 보고 있음



<자료> ULTra PRT.

[그림 2] 영국 히스로우 공항의 PRT



자율운전이 보급되면서 당연히 보안 대책도 더 중요해지는데, 자율운전 기술이 안전하다고 어떻게 보증할 수 있는지, 보증을 위해서는 얼마나 다양한 환경에서 테스트 해야 할 것인지 등의 질문에 답을 할 수 있어야 한다고 보고 있음


자율운전 차는 네트워크로 연결되는 교통 인프라를 이용하게 될 것으로 보이는데, 이는 악의를 가진 공격자들에게 활동의 장이 넓어지게 됨을 의미하며, 이에 대한 보안 대책의 마련도 중요함


따라서 법적 정비가 필수불가결한데, AI 100 보고서는 현재 미국의 많은 주에서 자율운전 차량에 적용할 수 있는 규정이 정비되어 있지 않다는 점을 지적하고 있음


현재 미국의 네바다, 플로리다, 캘리포니아, 미시간주와 캐나다 온타리오주가 자율운전 자동차를 도로에서 테스트 할 수 있는 규정을 두고 있지만, 자율운전 차량이나 반()자동운전 차량이 사고를 일으킨 경우 누가 어떤 책임을 져야 하는지에 대한 조항은 마련되어 있지 않은 상태


◈ 고용과 직장(Employment and Workplace) 분야는 인간의 일을 AI가 빼앗을지도 모른다는 민감한 주제와 연관이 있어, 운송 분야보다는 보고서의 표현이 보다 신중함


보고서는 우선 AI가 급속하게 진화하여, 한 세대 안에 인간의 모든 직업을 바꿔 버리는 돌발적인 시나리오는 있을 수 없을 것이라 적시하고 있음


그러나 AI는 거의 모든 직업 영역을 서서히 잠식해 갈 것이고 컴퓨터가 일을 빼앗아가면 인간은 물러날 수밖에 없게 된다고 말함으로써 AI에 의한 인간 노동의 대체 가능성을 시사하고 있음


보고서는 AI의 영향력을 전망할 때 지금까지 디지털 기술이 인간의 노동에 어떤 영향을 미쳤는지를 살펴보는 것이 도움이 된다 말하고 있음


• 지금까지의 디지털 기술은 주로 반복적 작업의 효율화를 목적으로 하고 있으며, 주로 여행사의 업무 같은 중간 레벨의 일이 낮은 레벨 또는 높은 레벨의 일보다 기술의 영향을 받고 있음


AI가 확산됨에 따라 영향을 받는 범위가 더 확대될 가능성이 있는데, 보고서는 지금까지 기계로 대체되지 않았던 전문 서비스와 같은 높은 스킬을 요하는 작업도 대체될 수 있다고 전망하고 있음


[동영상] 세계 최초의 AI 변호사 ROSS


AI가 대체하는 것은 당분간 직업이라기보다는 작업(task)일 것인데, 가령 변호사 업무의 대부분은 아직 AI로 자동화되어 있지 않지만, 법률에 관한 정보를 추출하여 주제별로 정리하는 작업의 자동화는 진행되고 있으며, 이는 1년차 변호사가 하는 작업을 대체하는 것에 해당함


보고서는 AI가 기존의 직업을 대체하는 한편, 새로운 직장·직업을 만들어내는 데에도 기여할 수 있다고 보는데, 어떤 일이 없어질 것인가는 예상할 수 있어도, 어떤 일이 새롭게 만들어 질 것인가를 미리 상상하기는 어렵다는 점을 고백하고 있음


AI는 기업 조직의 형태에도 영향을 줄 것으로 예상되는데, AI의 시대에는 사업 규모의 확대가 곧 노동자 수의 확대로 직결되지는 않을 전망임


지금까지의 기업은 노동 자원인 사람의 수를 늘려 사업의 거점을 국내외로 넓히는 수평적 확대나, 조직의 계층적 구조를 늘려나가는 수직적 확대를 통해 조직을 키우고 비즈니스 규모를 확대해 왔음


AI가 대부분의 노동을 대체하게 되면 비즈니스 규모를 확대하기 위해 조직 규모를 키우지 않아도 되며, AI 기반의 노동 아웃소싱 시장이 확립되면, 대부분 기업이 사업 규모가 확대되더라도 전체 직원들이 서로 얼굴을 알고 지내는 규모로 유지될 수도 있음


◈ 보고서는 AI의 발전이 가져올 부(, wealth)를 어떻게 분배할 것인가 하는 문제도 매우 중요한 아젠다가 될 것으로 내다보고 있음


AI가 다양한 영역에서 노동을 대체하게 되면 상품과 서비스의 원가가 줄어 낮은 가격에 구매할 수 있게 되는데, 이 점만 본다면 많은 사람이 더 많은 사람이 부자가 된다고 유추할 수 있음


• 그러나 서서히 진행되기는 하겠지만 AI가 거의 모든 직업 영역에 영향을 미치고 수입이 높은 경험적 지식에 근거한 일도 빼앗을 수 있기 때문에, 사람들이 지금보다 더 가난해질 가능성도 분명 존재함


보고서는 AI가 가져올 대대적인 구조적 변화에 대응하기 위해 기본 소득(최저 소득 보장) 등 사회안전망의 필요성을 설파하고 있음


이러한 사회안전망이 없다면 사회의 극히 일부 상류층만이 AI의 혜택을 받는 될 것이라고 AI 100 보고서는 경고하고 있는데, AI가 가져올 부를 어떻게 공유할지에 대해 지금부터 논의해도 결코 이른 것은 아니라 말하고 있음


실제로 올해 6 5일 스위스에서는 인공지능에 의한 일자리 감소 문제 해결을 위해 성인 1인당 매월 2,600달러를 지급하는 기본소득 법안에 대한 국민투표가 전세계 최초로 실시된 바 있는데, 인공지능 시대의 중대한 화두를 전세계에 던졌다는 평가



<자료> Basic Income 2016.


[그림 4] 스위스의 기본소득 법안 찬성 집회


◈ 운송과 노동 분야의 전망만 놓고 보더라도, AI가 영향을 미치는 범위는 지엽적인 것이 아니라 경제적, 사회문화적으로 광범위하다는 것을 충분히 머리 속에 그려볼 수 있음


가령 자율운전 차는 운전자가 필요 없게 된다는 사실 하나만으로도 상당한 사건이지만, 그에 그치지 않고 차량을 소유하지 않는 문화를 확산시켜 자동차 제조업과 판매·수리 업, 주유소, 자동차 용품 제조업, 주차장 사업 등에 광범위한 영향을 미치게 됨


직장에서 멀리 떨어진 곳에 사는 것이 별다른 문제가 되지 않게 된다면, 부동산·주택 판매 회사는 물론 대중교통에서 도시 계획까지 전면 재검토해야 할 수도 있음


이용자들도 편의성이 극적으로 제고되는데, 특히 고령자나 장애인 같이 운전을 하고 싶어도 하기 어려운 사람들이 일상적으로 자율운전 차량을 이용할 수 있게 됨으로써 얻게 되는 장점은 이루 헤아릴 수 없음


따라서 AI 활용의 긍정적인 이미지를 염두에 두면서, 예상할 수 있는 영향력을 최대한 파악하여 필요한 조치를 함으로써 불안과 위험을 불식시키거나 경감시킬 필요가 있음


AI 활용과 보급을 주도하는 입장에 있는 기업이나 조직은 사람들에게 부정적인 이미지가 선행하지 않도록, 적어도 AI에 의해 직접 영향을 받게 될 것으로 예상되는 이용자들에게 관련 정보를 알기 쉽게 공개하려는 노력을 기울일 필요가 있음


AI 100 보고서가 그리는 미래가 확실한 것도 아니며 이에 대한 판단은 제각각일 수 있지만, 확실한 것은 능동적으로 대처했을 때 어떤 미래든 받아들일 수 있게 된다는 점


AI 100 보고서는 2030년까지 범용 인공지능(AGI: artificial general intelligence)이 실현 될 것으로 가정하고 있지 않은데, 8개 분야로 나누어 AI를 살펴본 데서 알 수 있듯, 인간처럼 폭넓은 적용 범위와 일반화 능력을 가진 AGI는 상정하고 있지 않음


반면 특이점에 도달해 가고 있으며 2030년경에 AGI가 실현될 것으로 예상하는 견해도 있으며, 이렇게 된다면 인간의 직업 대부분이 AI에 빼앗기게 되는 디스토피아가 단번에 현실화될 가능성도 배제할 수 없음


4 년 후인 2020년의 일조차 예측하기 어려운데, 그보다 더 10년 후에 어떻게 되어 있을지는 사실 아무도 정확히 모른다고 보아야 함


그렇다면, 앨런 케이의 말대로 미래를 예측하는 가장 좋은 방법은 미래를 발명하는 것이다라는 자세가 필요하며, AI에 능동적으로 대처할 수 있어야 장차 어떤 미래가 펼쳐지든 그 결과를 받아들일 수 있는 마음가짐이 만들어질 수 있을 것

※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1770호(2016. 11. 02 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

인간의 감정을 이해하는 인공지능 -목소리 톤에서 감정을 읽는다.pdf



[ 요 약 ]


기계가 인간의 감정을 이해하고 인간미 있는 동작을 취하고기계가 인간과 대화를 하며 그 자리의 느낌을 이해할 수 있다면인간이 기계를 바라보고 인식하는 태도는 아마 지금까지와는 사뭇 달라질 것임최근 인간의 감정을 이해하는 인공지능(AI)들이 등장하기 시작하며전통적인 기계와 인간의 관계가 바뀌려 하고 있으며인간과 AI의 공존의 전제조건이 될 사람과 기계 사이의 정서 관계가 생성되기 시작할 날도 그리 멀지 않을 것으로 예상되고 있음



[ 본 문 ]


◈ 이스라엘에 본사를 둔 벤처 기업 비욘드 버벌(Beyond Verbal)은 회사 명에서 알 수 있듯이 사람의 목소리를 분석해 감정과 성격을 추출하는 기술을 개발하고 있음


인간의 목소리는 콘텐츠를 전달할 뿐만 아니라 말하는 사람의 심정을 드러내 주는데, 문화인류학자들은 사람 사이의 대화에서 전달되는 정보의 90% 이상은 말이 아니라 목소리 톤이나 얼굴 표정, 몸짓 등 비언어적 요소에 있다고 말하고 있음


비욘드 버벌감정 분석(Emotions Analytics) 기법은 시장 조사에 응용되고 있으며, 음성에서 질병을 진단하는 연구에 적용되어 큰 성과를 올린 것으로 보고되고 있는데, 이런 연구는 궁극적으로 인간처럼 행동하는 시스템 개발과 연결될 것으로 기대됨



비욘드 버벌이 감정 분석 기술이 적용된 스마트폰용 앱 무디스(Moodies)를 출시하고 있기 때문에, 이 감정 분석 기술은 현재 누구나 이용해 볼 수 있음



<자료> Appstore.


[그림 1] 비욘드 버벌의 무디스 앱


앱을 실행시킨 다음 말을 하면 목소리 톤을 분석해 거기에 배어 있는 감정을 추출하는데, 육성이 아니라 녹음된 음성도 가능하므로 정치인이나 유명인들의 연설 혹은 발언을 입력해 감정 분석을 할 수도 있음


감정은 거짓말을 하지 않는다(Feelings Dont Lie)를 모토로 내세운 비욘드 버벌은 감정 분석 기술을 인정받아 지난 9월 초 300만 달러 투자를 유치하는 등 시리즈 A 펀딩에서 현재까지 총 700만 달러 이상의 투자를 받은 것으로 알려짐


◈ 무디스의 분석 능력을 보여주기 위해 비욘드 버벌은 오바마 미국 대통령이 히로시마 평화 공원에서 행한 연설이 앞쪽 3분을 입력한 후 분석된 결과를 공개하고 있음



<자료> Whitehouse.


[그림 2] 오바마의 히로시마 공원 연설


• 71년 전 구름 한 점 없이 맑은 어느 아침 날에 하들로부터 죽음이 떨어져 내렸고 세계는 달라졌습니다...(Seventy-one years ago, on a bright cloudless morning, death fell from the sky and the world was changed...)로 시작하는 연설은 묵직한 어조로 진행


전쟁의 비참함을 호소하는 연설이지만, 무디스 앱의 분석은 다른 견해를 나타냈는데 서두 부분 오바마 대통령의 심정은 동기 유발(Motivation)이라고 판정하며, 청중을 고무하기 위한 연설이자 동시에 문제에 대한 해결책을 모색하려는 것이라고 해석



<자료> Beyond Verbal.


[그림 3] 오바마 연설의 음성 분석 결과


 연설의 톤은 시간마다 바뀌어, 동기 유발 외에도 위엄(Dominance), 희망(Hope), 친밀감(Friendliness) 등의 분석 결과가 이어지며 연설 도중 심경의 변화가 계속해서 발생했음을 그래프와 함께 보여주고 있음


전반적으로 무디스 앱은 오바마가 해결책을 찾기 위한 노력이 진행 중이라는 것에 대해 심정적으로 긍정적인 평가를 내리고 있음(그래프의 녹색 영역, embracive)


그러나 한편으로는 희망을 전하려 해도 현실은 다르다고 느껴 감정적으로 우울한 평가를 내리는 측면도 있다고 분석하고 있음(그래프의 하늘색 영역, somber)


대부분의 사람에게는 무겁고 고뇌에 찬 연설로 들렸지만, 무디스 앱에 의하면, 오바마 대통령의 심중은 세계 평화를 호소하는 고무적인 감정과 프라하 선언 이후 부진한 핵무기 폐기에 대한 좌절감이 엇갈려 있었음을 알 수 있음


◈ 비욘드 버벌은 감정 분석 기술로 미국 공화당 대선 후보 도널드 트럼프가 폭스 뉴스의 메간 켈리와 진행한 공개 토론회에서의 답변을 분석한 결과도 공개하였음


무디스 앱의 감정 분석에 따르면, 트럼프의 답변에서 느껴지는 감정은 카리스마(Charisma), 창의성(Creativity), 장난끼(Playfulness), 추파(Flirtation), 따뜻함(Warmth) 등임



<자료> Beyond Verbal.


[그림 4] 트럼프 연설의 음성 분석 결과


•  토론회를 TV로 본 사람들은 대체로 트럼프의 발언이 매우 재미 있고 관객을 끌어 당기는 매력이 있다고 느꼈다고 하는데, 감정 분석의 결과 역시 재치 있고 장난기가 풍부하며 엔터테이너로서 탁월한 능력을 보유하고 있음을 보여주고 있음


트럼프는 발언 내용 중 부적절한 표현이나 편향된 인식이 많아 정치인으로서 평가는 대체로 높지 않으며 정치적 수완에 대해서는 물음표가 많이 붙지만, 비욘드 버벌은 트럼프 인기의 비밀이 바로 말의 정서적 측면에 있음을 확인해 주고 있음


◈ 비욘드 버벌은 감정 분석 기술을 기업용 솔루션으로도 제공하고 있는데, 감정에 관한 것이니만큼 주로 시장조사 목적에 활용되고 있음


기업은 제품의 브랜드와 디자인에 대해 조사할 때 감정 분석 기술을 이용해 실제로 어떻게 느끼는 지를 파악하려는 시도를 하고 있으며, 또한 사람들이 실제로 느끼는 광고 효과를 검증하는 데에도 이용하고 있음


조사에 응한 사람들에게 브랜드나 디자인, 광고물에 대한 정서적인 질문을 하고 답변을 녹음한 다음, 이 음성을 감정 분석 기술로 파악해 응답자들이 대상물에 대해 어떤 심정을 가지고 있는지를 분석하는 것임


기업이 알고자 하는 것은 표면적인 대답의 의미가 아니라 음성에 담겨 있는 감정이며, 사람이 겉으로 하는 말은 때론 진실과 다를 수 있고 건성으로 답하는 경우도 있지만 음성에 포함된 신호는 거짓을 말하지 않는다는 전제 하에 가능한 시도임


◈ 한편 현대인들 중에는 자신의 감정을 제대로 이해하는 것이 매우 어렵다고 느끼는 사람이 적지 않은데, 무디스 앱은 일상 생활에서 건강 관리의 도구로도 이용할 수 있음


가령 전화 통화 등을 앱으로 분석하여 그 때의 심정이 어떠했는지를 파악할 수 있는데, 자신은 힘찬 어투로 말했다고 생각했지만 앱으로 분석한 결과가 쓸쓸함(Loneliness)이나 불만족(Unhappy)으로 나올 수도 있음


무디스 앱으로 자신의 감정을 분석해 본 이용자들 중에는 실제로 자신이 생각한 마음가짐과 실제 분석 결과가 다른 것에 놀라는 경우가 많다고 함


건강이 좋지 않을 때는 일부러 약간 큰 목소리로 말하려는 경향이 있으나, 앱으로 분석하면 이런 노력은 실제로는 전혀 먹히지 않음을 알 수 있는데, 심정은 목소리의 크기나 음정과는 상관관계가 없어 이런 잔기술로는 상대를 속일 수 없음을 알 수 있음


건강에 관련한 문제는 빠른 조치가 필요한데, 앱 분석 결과가 좋지 않다면 기분 전환을 할 수 있는 휴식이나 여가 활동 등 건강 관리 활동을 할 필요가 있음


부정적 분석 결과를 받은 이용자들이 기분 전환 후 다시 앱을 실행하면 분석 결과가 긍정적으로 나타나는 경우가 많은데, 이런 사례를 통해 목소리에서 자신의 심리 상태를 판단하여 건강한 생활을 유지하는데 활용할 수 있다는 단서를 발견할 수 있음


실제 비욘드 버벌에 투자를 한 벤처캐피털들은 이들의 감정 분석 기술이, 측정 데이터를 통해 건강을 스스로 관리하는 계량화된 자아 운동(quantified self movement)과 궤를 같이 한다는 점에서 높은 평가를 한 것으로 알려져 있음


◈ 이 감정 분석 기법의 의학적 근거를 정립하기 위해, 비욘드 버벌은 메이요 클리닉(Mayo Clinic)과 스크립스(Scripps) 등 선진 의료기관과 공동 연구를 전개하고 있음


최근 연구 결과에 따르면, 목소리는 실제로 감정을 포함뿐만 아니라 건강 상태의 마커(marker, 표시자)를 내포하는 것으로 나타났다고 함


특히 피험자의 목소리가 심장 질환 관련 신호를 포함하는 것을 발견했는데, 음성 신호가 심장 질환의 바이오 마커가 되므로 음성을 녹음하면 질병을 판정 할 수 있다고 함


이보다 앞서 음성은 자폐증이나 파킨슨병과도 관련이 있음이 밝혀지기도 했으며, 또한 음성과 우울증 및 난독증과의 관계도 해명되고 있는데, 이로써 우리가 하는 말은 건강을 비추는 거울이기도 하다는 점이 규명되고 있음


◈ 음성과 질병의 관계를 의학적으로 해명한 것은 비욘드 버벌이 처음인데, 최근 들어 스마트폰이나 웨어러블 기기로 질병을 진단하는 기술들이 속속 등장하고 있음


 애플은 임상 시험을 위한 플랫폼인 리서치킷(ResearchKit)을 제공하고 있는데, 의료기관은 이 플랫폼을 이용해 단시간에 대규모 임상 시험을 실시할 수 있고, 임상 시험에 참여하는 피험자는 리서치킷에서 제공되는 앱으로 간단한 시험을 실시할 수 있음


파킨슨병에 대한 임상 시험 앱으로는 엠파워(mPower)가 주목 받고 있는데, 이는 비영리 단체인 세이지 바이오네트웍스(Sage Bionetworks)가 개발한 것으로, 피실험자들은 아이폰용 앱에서 지시에 따라 몇 가지 조작을 하면 파킨슨병 여부를 판정 할 수 있음


피험자들은 세 가지 작업을 지시 받는데, 손가락으로 버튼을 누르고 마이크에 ~하고 소리를 내며, 기억력을 시험하는 문제에 답하게 되는데, 피험자들의 테스트 결과를 집계하여 대규모의 파킨슨병 임상 시험을 전개 할 수 있게 되었음



<자료> Sage Bionetworks.


[그림 5] 파킨슨병 임상시험 앱 mPower


◈ 비욘드 버벌은 현재의 컴퓨터는 인간의 감정을 이해할 수 없는 감정맹(Emotional Blind)이라며, 자신들의 최종 목표는 기계에 인간의 감정을 이해시키는 것이라 말하고 있음


비욘드 버벌의 목적은 기계가 감정의 수준에서 인간과 커뮤니케이션 하는 것인데, 이를 위해서는 기계가 인간의 감정을 실시간으로 파악하는 것이 필요하며, 이 정보를 시스템에 피드백 함으로써 컴퓨터가 이용자의 감정에 따라 대응하도록 해야 함


현재 애플 시리(Siri)지금 내가 무슨 일을 하면 좋을까?라고 물어 보면 재미있는 질문이군요(Interesting question)라는 엉뚱한 대답을 받게 됨


만약 시리가 사용자의 말투에서 감정을 이해하게 된다면 인간과 같은 반응을 기대할 수 있는데, 일이 바빠서 피곤하다고 파악하면 시리가 잠깐 휴식을 취하고 차를 마시자고 제안할 수도 있고, 우울할 때는 좋아하는 곡을 재생해 줄 지도 모름



<자료> The Wall Street Journal


[그림 6] 비욘드 버벌 음성 분석 기술 개요


  애플 시리 뿐만 아니라 아마존 에코에 내장된 인공지능 알렉사(Alexa)나 구글홈에 내장된 구글 어시스턴트(Google Assistant)도 사람의 목소리에 들어있는 감정을 이해하고 인간미가 느껴지는 기능을 개발하고 있을 것으로 보이는데, 비욘드 버벌의 기술은 감정을 이해하는 컴퓨터 구현의 기초가 됨


인간과 기계, 인간과 AI의 공존 시대를 이야기하지만, 컴퓨터가 아무리 지능이 뛰어나도 감정을 이해하지 못하는 깡통일 뿐이라는 인식은 인간과 기계 간의 관계 형성에 제일 큰 장벽인 것이 사실


만일 인공지능들이 감정 분석을 통해 인간의 감정을 이해할 수 있다고 하면, 그것이 진정한 감정의 이해인지에 대한 논란은 다시 벌어지겠지만, 최소한 지금까지와는 다른 인간과 기계 간의 감정적 관계 형성이 시작될 수 있을 것이며, 이는 새로운 기계시대로의 진입을 알리는 또 하나의 징표가 될 수 있을 것


※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1770호(2016. 11. 02 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

AI 파트너십에 애플이 불참한 이유 - 프라이버시 보호.pdf



◈ 지난 9월 말 인공지능(AI) 개발에 적극적인 구글, 페이스북, 아마존닷컴, 마이크로소프트, IBM IT 대기업 5개사는 인공지능 파트너십(Partnership on AI)의 결성을 발표


지금까지 AI는 각 기업에 의해 개별적으로 연구 개발이 진행되어 왔으나, 새 컨소시엄은 사용자 측도 포함한 업계 단체로 AI를 최선으로 활용하는 것을 목표로 함


기업의 울타리를 넘어 AI가 윤리와 법제도에 맞게 안전하고 투명하게 개발되도록 하자는 취지로 이사회에는 사회 정책 및 윤리학자, 비영리 단체 전문가들이 참여


AI 파트너십은 열린 조직이며 앞으로도 기업과 개인의 참여에 대해 문호를 개방한다고 하는데, 발표 당시 눈길을 끌었던 것은 애플과 인텔의 이름이 명단에 없는 점


이를 두고 일각에서는 애플의 불참 결정은 폐쇄적인 기업 문화와 함께 AI 기술이 경쟁사와 비교해 부족하다고 느끼는 열등감 때문인 것으로 보인다고 분석했으며, MS는 애플을 계속해서 설득해 파트너십에 참여할 수 있도록 노력하겠다는 입장을 표명


◈ 애플이 불참한 이유가 AI를 경시하고 있기 때문은 물론 아닐 것이며, 최근 애플 임원의 강연이나 신제품 발표회에서 AI와 기계학습이라는 키워드는 빠지지 않고 등장함


그럴 수밖에 없는 것이, 업계에서는 AI 관련 키워드들이 트렌드가 된 지 오래이며, 구글만 해도 10월에 있은 신제품 발표회에서 AI 어시스턴트 기반 채팅 앱과 이를 활용하기 위한 새로운 스마트 기기를 선보였음


아마존 역시 인공지능 기술이 접목된 스마트홈 허브 기기의 업그레이드 모델을 선보이며, 차세대 핵심사업으로 키우려는 움직임을 보이고 있음


AI 비즈니스의 방향성이 문제일 뿐, AI는 모바일과 클라우드처럼 비즈니스의 기본 환경이 되고 있는 상황이기 때문에, 애플 역시 비록 AI 파트너십 초기 멤버에 참가하지는 않았지만, AI에 대한 연구개발 투자와 관련 기업 인수는 지속해 오고 있음


◈ 애플의 AI 연구 성과가 경쟁사에 비해 부족하다는 일각의 분석은, 타사의 음성 인식 가상 비서 기능과 애플의 시리(Siri)를 비교해 보면 일면 타당한 면이 있음


음성 인식 비서 시리는 원래 앱스토어에 등록된 앱이었으며, 애플은 시리를 인수하고 이어 시리의 강화를 위해 AI 관련 기업의 인수를 가속화 해오고 있음


음성 인식 어시스턴트로서 시리의 부족한 점은 시리는 음성 명령을 이해하고 있을 뿐이지 AI가 작동한다는 느낌을 주지 못한다는 것인데, 나는 무엇 무엇을 할 수 있으니 한 번 시험해 보세요라는 식으로 사용자에게 먼저 적극적 제안을 하지는 못함


iOS 10으로 업그레이드 된 이후 그나마 사용자들이 애플의 기계학습 역량을 경험해 볼 수 있게 된 것은 사진 기능으로, 사진 라이브러리에 메모리 기능이 나타나 날짜와 장소, 사진 속 인물과 장면 등에 따라 사진을 자동으로 분류하고 정리해 줌


새로워진 검색 기능은 사진에 찍힌 대상물을 말로 검색 할 수 있는데, 검색 키워드는 사용자가 손으로 달아 놓은 거이 아니라 기기에서 분석해 부여한 것이며, 얼굴 인식률도 높아 전화번호부에서 이름에 사진을 할당하면 인명으로 사진 검색도 가능함


애플은 자신들의 개인정보보호 정책에 따라 사진을 서버 등 외부에 공유하지 않고 기기 자체에서 이러한 기능을 실현하고 있음


이 점이, 페이스북이나 구글과의 차이점이며, 이들에 비해 분석 데이터의 절대적인 양이 적기 때문에 AI의 학습과 발달 속도는 더딜 수밖에 없기 때문에, 이유야 어찌 되었든 애플이 경쟁사에 비해 AI 기술력이 뒤쳐진다는 분석은 타당한 면이 있음


◈ 애플은 앞으로도 개인정보보호 지침을 고수하면서, 보다 개인적인 차원에서 기계학습과 AI를 활용해 나갈 것으로 예상되는데, 이런 입장을 이해하는 바탕 위에 AI 파트너십 참여가 논의되어야 할 것으로 보임


지난 3월 미 연방수사국(FBI)이 범죄 조사를 목적으로 애플에 기기 잠금 해제 협조 요청을 했을 때 애플은 단호하게 거절한 바 있는데, 이는 애플이 아이폰을 매우 개인적인 것으로 보며, 프라이버시 보호에 높은 가치를 두고 있기 때문임


애플은 지난 7월 애플 개발자 회의에서 미분적 개인정보보호(differential privacy)라는 개념을 제시하며, 거대한 데이터 집합을 통해 개인의 행동과 요청을 예측하면서도 특정 개인의 정보는 들여다보지 않는 새로운 기술을 사용할 것이라 밝힌 바 있음


• 'differential'은 수학 용어로 미분이며, 미분은 특정 시점에서의 동향, 변화의 방향과 추세를 알아내는데 사용되는데, 특정 개인을 식별할 수 있는 정볼르 들여다보지 않고 큰 흐름을 파악하기 위한 것이란 의미를 담고 있음


  

     <자료> Apple


[그림 1] 애플의 Differential Privacy(미분적 개인정보보호)


이 기술은 경쟁사처럼 사용자의 클라우드에 축적돼 있는 데이터를 이용하는 것이 아니라, 개인의 데이터에 일부러 노이즈를 추가하여 모은 다음 분석을 하는 것임


물론 다른 기업이라고 해서 프라이버시를 경시하는 것은 아니며, 애플이 프라이버시를 강조하는 것은 기업용 시장을 확대하려는 전략에서 타사의 스마트폰과 플랫폼에 비해 애플은 보안이 단단하다는 것을 어필하려는 전략으로 볼 수도 있음


애플이 AI와 기계학습에 대해 보수적이거나 부정적인 것은 결코 아니지만, AI 파트너십에 참여한 업체들이 인공지능 기술의 발전에 대해 매우 긍정적인 것과 비교해 볼 때 다른 입장에 서 있는 것만은 틀림없음


보다 폭넓은 관점에서 AI 논의가 이루어지기 위해, 애플의 불참 선언을 폐쇄적이라거나 기술력이 없기 때문으로 폄하하는 대신, 애플이 가지고 있는 다른 입장을 유지한 채 AI 파트너십에 참가해 토론과 협력을 할 수 있도록 유도하는 것이 필요해 보임

※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1769호(2016. 10. 26 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

도전적인 아마존의 AI 전략-한 집에 여러 대의 AI 지원 기기 판매.pdf



[ 요 약 ]


아마존이 인공지능(AI) 스피커 에코 2세대 모델 가격 인하에 이어, AI 기능이 추가된 동영상 스트리밍 기기 파이어 TV 스틱 2세대 모델도 저가에 출시하였음. 특히 에코는 6, 12개 세트로 판매를 하고 있는데, 소비자들이 30~40 달러 대의 AI 지원 기기 여러 대를 한꺼번에 구매함으로써 스마트폰 환경을 대신할 수 있는 AI 이용 환경을 구축하게 하려는 전략으로 보임. 가격 전략과 함께 아마존은 기기에서 이용할 AI 기반 서비스 활성화를 위한 생태계 구축에도 적극 투자하고 있음



[ 본 문 ]


◈ 아마존닷컴은 클라우드 인공지능(AI) 기반의 음성 비서를 이용한 하드웨어 판매 확대를 노리고 있는데, 최근 발표한 파이어 TV 스틱(Fire TV Stick) 2세대 모델도 그 중 하나


아마존은 알렉사(Alexa)라 부르는 AI를 사용한 클라우드 기반의 음성 어시스턴트 서비스를 보유하고 있는데, 이 서비스를 사용할 수 있는 기기를 소형화하거나 아마존이 판매 중인 다른 여러 기기에 탑재함으로써 서비스 확대를 도모하고 있음


아마존의 파이어 TV 스틱은 TV HDMI 포트에 연결하는 기기로 무선 랜으로 인터넷에 접속하여 스트리밍 영상 등을 간편하게 즐길 수 있는 기기


<자료> Amazon.com


[그림 1] 2세대 아마존 파이어 TV 스틱


• 파이어 TV 스틱으로는 아마존의 영상 전달 서비스인 아마존 비디오(Amazon Video), 프라임 회원을 위한 영상 무제한 서비스 프라임 비디오(Prime Video), 음악 무제한 서비스 프라임 뮤직(rime Music)을 비롯, 넷플릭스, 훌루, 유튜브 등 타사 서비스도 이용할 수 있음


아마존 TV 스틱은 2014년에 시판되었으며, 아마존은 최근 2세대 모델인 파이어 TV 스틱 위드 알렉스 보이스 리모트(Fire TV Stick with Alexa Voice Remote)를 발표


2세대 모델은 이름에서 알 수 있듯 음성 비서 서비스 알렉사를 사용할 수 있는 것이 특징이며, 상위 모델인 파이어 TV와 같이 알렉사를 지원하는 음성 인식 리모컨이 딸려 있음


사용자는 리모컨의 마이크 버튼을 눌러서 말하는 것만으로 30만 개 이상의 영화와 TV 프로그램, 90 개 이상의 앱이나 채널 중에서 원하는 내용을 검색 할 수 있으며, 알렉사를 지원하는 다양한 서비스를 이용 있음


◈ 아마존의 의도는 파이어 TV 스틱 2세대 모델의 가격 전략에 명확히 나타나는데, 새로운 모델의 가격은 39.99 달러로 알렉사를 이용할 수 있는 기기 중 최저가임


2년 전에 발매된 초기 모델의 가격이 39 달러이고, 음성 인식 리모컨 기능을 이용하려면 30 달러의 별매 리모컨을 구매해야 하며, 게다가 이 별매 리모컨이 콘텐츠 검색만 할 뿐 알렉사 이용은 할 수 없음을 감안하면 2세대 모델의 가격은 파격적임


아마존이 시판 중이거나 향후 출시 예정인 알렉사 지원 기기들의 가격을 보면, 독립형 음성 지원 단말기인 아마존 에코(Amazon Echo)179.99 달러, 영상 전달 장치 상급 모델인 파이어 TV99.99 달러, 태블릿인 파이어HD 889.99 달러 등임


이들 기기들은 모두 가격이 파이어 TV 스틱의 2배 이상인데, 바꿔 말하면 아마존은 이번에 알렉사를 이용할 수 있는 기기의 가격을 대폭 인하한 셈


◈ 아마존의 최근 움직임 중 또 하나 흥미로운 것은 독립형 음성 지원 스피커인 아마존 에코의 소형 버전인 에코 닷(Echo Dot)의 판매전략임


아마존은 파이어 TV 스틱의 2세대 모델 발표 2주 전에, 에코 닷의 2세대 모델도 발표했는데, 판매 가격을 종전 89.99 달러에서 49.99 달러로 인하하였음


게다가 아마존은 에코 닷 기기 6개 세트와 12개 세트 패키지를 마련하고 각각 5대와 10대 가격으로 판매하고 있는데, 패키지로 구매할 경우 대당 가격은 약 41.7 달러로 내려감


이 패키지는 마치 예전 탄산 음료의 멀티 보틀 팩 같지만, 이러한 판매 방식이야말로 아마존의 새로운 전략을 잘 드러내고 있는데, 아마존은 집 곳곳에 놓아 두려는 수요를 상정하고 신형 에코 닷을 출시했다고 설명


가령 에코 닷 하나는 침실에 두고 음성 명령으로 알람을 설정하거나 조명을 제어하며, 또 하나는 주방에 두고 타이머를 설정하거나 측정 단위 변환 등을 묻는 데 쓰는 등, 이제 한 집에 AI 지원 단말기가 하나만 있지는 않을 것이라는 게 아마존의 생각임




<자료> Amazon.com


[그림 2] 아마존 에코 닷 2세대 모델() 6/12개 들이 패키지 상품(아래)


◈ 신형 에코 닷 모델은 미리 에코 공간 인식(ESP, Echo Spatial Perception)이라 부르는 기능을 탑재하고 있는데, 이 역시 한 집에서 여러 대가 사용될 것을 상정한 것임


이 기능은 여러 대의 에코 닷이 사용자의 음성 명령을 들은 경우, 사용자와 거리를 인식해 가장 가까운 에코 닷이 대응하도록 하는 것으로, 아마존에 따르면 이를 통해 2대 이상이 동시에 명령에 응답하는 문제를 해결할 수 있음


애플의 음성 비서 서비스인 시리(Siri)의 경우, 만일 여러 대의 애플 기기를 사용하는 사람이 시리를 호출했을 때 아이폰과 아이패드가 동시에 반응할 수 있지만, 에코 닷에서는 이런 문제가 없어진다는 것


아마존은 이 ESP 기능을 향후 에코 시리즈의 모든 모델에 무료 소프트웨어 업데이트로 제공한다는 방침


또한 에코 닷의 색상은 지금까지 블랙 한가지였지만 신모델에서는 새로 화이트 모델을 추가했으며, 상위 기종인 아마존 에코 역시 블랙 일변도에서 화이트 모델을 새로 추가


아마존은 에코가 집 안의 어떤 방에도 조화를 이루도록 디자인했다고 설명하고 있는데, 색상의 추가도 집 안에 여러 대의 에코 기기를 놓게 하려는 전략의 일환으로 보임


에코 시리즈는 지금까지 미국에서만 판매되었지만, 아마존은 최근 에코와 에코 닷을 영국과 독일에서도 판매한다고 발표하며, AI 비서 서비스의 외국 진출도 시작하였음


◈ 아마존은 에코의 판매대수를 공개하고 있지 않지만, 어느 정도 성공을 거두고 있는 것으로 알려져 있으며, 사용할 수 있는 알렉사 기반 서비스 종류도 계속 증가 중에 있음


2014 11월 아마존이 에코를 미국에서 처음 발매할 당시, 대다수 소비자들은 물론 전문가들도 에코를 어떻게 평가해야 할 지 몰랐지만, 음성인식 비서인 알렉사 기능과 마이크의 성능이 소비자에게 어필하면서 긍정적인 평가를 고 있음


아마존이 공식적으로 인정한 판매대수는 아니나, 시장조사기관 CIRP(Consumer Intelligence Research Partners)에 따르면 에코의 누적 판매대수는 300만 대로 추정되는 등 어느 정도 성공을 거두고 있는 것으로 보임


현재 아마존은 알렉사에서 이용할 수 있는 서비스의 확충을 도모하고 있는데, 가령 올해 7월에는 알렉사를 통해 아마존닷컴에서 주문할 수 있는 상품의 수를 크게 늘렸음


아마존은 이미 지난해 6월부터 알렉사를 외부 기업에 공개하고, 각 기업의 하드웨어나 소프트웨어와 연계시키는 데 필요한 소프트웨어 개발 키트(SDK)알렉사 스킬 키트(Alexa Skills Kit, ASK)를 무상 제공해 오고 있음


◈ 아마존이 최근 공개한 데이터에 따르면, 아마존이 스킬이라 부르는 알렉사 기반 서비스나 기능의 수는 이미 3천 개를 넘어섰으며 생태계를 구축해 가고 있음



<자료> Amazon.com


[그림 3] 아마존 스킬 앱스토어


알렉사는 처음에 음악을 재생하거나, 뉴스와 일기 예보를 들려 주거나, 전자 책을 낭독하거나, 아마존에서 쇼핑하는 데 용도가 한정되었지만, SDK를 외부 기업에 공개함으로써 스킬의 수를 단숨에 증가시킬 수 있었음


올해 6월말에는 미국의 대형 로컬은행인 캐피탈 원(Capital One), 피자 배달업체 도미노, 피트니스 손목밴드 핏빗(Fitbit), 여행정보 검색 서비스 카약닷컴(KAYAK.com), 스마트 홈 플랫폼 스마트씽즈(SmartThings), 배차 서비스 우버 등이 스킬의 제공을 시작


• 캐피탈 원의 스킬로는 계좌 잔액을 알려줘 혹은 예금 계좌의 최근 입출금 상황을 알려줘 등의 명령이 가능하며, 핏빗 스마트 피트니스 워치를 이용 중인 사람은 귀가 후에 그날의 걸음 수와 소비 칼로리 등을 음성으로 알려달라 요구할 수 있음


또한 지난 9월에는 트위터, 요리 전문 케이블 채널 푸드 네트워크(Food Network), 가전 업체인 GE 어플라이언스, 경제 및 금융정보 미디어 블룸버그, 완성차 업체인 현대자동차 등이 스킬의 제공을 시작하였음


이렇게 되면 음성 명령으로 트윗을 듣거나, 방송중인 프로그램에 소개된 음식의 요리법을 전송해 달라고 요청하거나, 오븐을 예열하도록 명령하거나, 주가 정보를 듣거나 자동차 문을 잠그거나 하는 등의 일을 알렉사를 통해 할 수 있게 되는 것임


◈ 아마존은 스킬 생태계 확장 시도 외에, 아마존 고유 서비스의 가격을 대폭 낮추는 대신 에코 전용으로 재상품화하는 전략도 병행하여 전개하고 있음


아마존은 최근 정액제 음악 스트리밍 서비스인 아마존 뮤직 언리미티드(Amazon Music Unlimited)를 미국에서 시작했는데, 여러 기기에서 사용할 수 있는 표준 서비스는 월에 9.99 달러이며, 기존 프라임(Prime) 회원은 월 7.99 달러, 연간 79 달러에 이용할 수 있음


아마존은 이전까지 연간 99 달러 또는 매월 10.99 달러를 내는 프라임 회원이 추가 비용 없이 음악을 들을 수 있는 스트리밍 서비스 프라임 뮤직(Prime Music)을 제공했었음


아마존의 설명에 따르면 기존 프라임 뮤직에서 제공하고 있는 음원 수는 약 200만 개, 재생 목록 및 스테이션의 수가 약 1,000개였던 것에 비해, 새로운 서비스는 수천 만 곡과 수천 개의 재생 목록 및 스테이션이 제공될 것이라고 함


주목할 것은 새로운 스트리밍 서비스를 준비하면서 아마존이 에코 시리즈에서만 사용할 수 있는 전용 요금제(Amazon Music Unlimited for Echo)도 함께 마련했다는 사실


에코 전용 요금제는 프라임 회원이나 비회원 모두 월 3.99 달러로 현재 디지털 음악 서비스의 표준처럼 되어 있는 월 10달러보다 매우 저렴하지만, 하나의 에코 단말기에서만 사용할 수 있다는 제약이 있음


에코 전용 요금제 적용 단말기는 에코, 에코 닷, 아마존 탭 등이며, 이들 기기에 탑재된 음성 비서 서비스 알렉사에 노래 제목, 가수 이름, 연대, 분위기나 무드, 가사의 일부를 말하면 음악을 재생할 수 있음


◈ 아마존의 이러한 에코 관련 행보는 10월 초 구글이 아마존과 동일한 사업전략을 들고 나와 스마트홈을 겨냥함에 따라 

더욱 주목받고 있음


구글은 에코에 대항하는 스피커 제품으로 구글 홈(Google Home)을 선보이며, 구글 홈을 주방과 거실 등에 배치하면 집안 어디에서나 스마트폰 없이도 인공지능 비서인 구글 어시스턴트를 이용할 수 있게 되는 셈이라고 제품의 의의를 설명



<자료> Made by Google


[그림 4] 구글의 인공지능 스피커 구글 홈


구글 홈은 에코와 마찬가지로 뉴스 프로그램과 팟캐스트 등의 재생을 지원하며, 음성 명령으로 사칙 연산과 단위 변환, 날씨나 주가 확인, 스포츠 경기 결과 확인 등이 가능함



• 에코처럼 음성 명령을 사용하여 음악을 재생시킬 수도 있는데, 유튜브 뮤직, 구글 플레이 뮤직 외에 세계 최대 음악 스트리밍 서비스인 스포티파이(Spotify)도 지원한다고 하며, 정확한 곡명을 모르는 경우에도 검색을 통해 음악을 식별해 내는 기능을 지원하고 있음


구글 홈 역시 스마트 가전을 제어하는 기능을 갖추고 있어, 필립스와 네스트, 스마트씽즈, IFTTT 등의 제품과 연계가 가능함


에코가 블랙에 화이트 색상을 추가한 것에 비해 구글 홈은 더 많은 색상과 소재를 제공해 개인별 선호도에 따라 가정의 인테리어 등에 맞춰 선택할 수 있게 하였음


구글이 에코와 거의 동일한 기능을 가진 제품을 들고 나왔다는 것은 아마존 입장에서 부담이 될 수도 있지만, 한편으로는 아마존이 선도적으로 시작한 인공지능 스피커 제품이 소비자들에게 반향을 불러 일으키고 있다는 방증이므로 긍정적인 효과도 있음


◈ 아마존이 알렉사 기반의 기기 비즈니스를 강화하는 이유는 클라우드와 AI 기술을 활용해 침체된 스마트폰 시장을 대체할 새로운 영역을 개척하기 위한 것으로 분석됨


구글이나 애플이 스마트폰 이후 다음 성장 분야를 찾아야 하는 상황이라면, 아마존은 스마트폰 시장 진출에 ​​실패해 큰 타격을 입은 경험을 가지고 있기 때문에, 스마트폰 시장이 정체된 타이밍을 계기로 새로운 분야에 주력해 반격을 도모해야 하는 상황임


하드웨어 수익이 높은 애플이나 광고 수익이 높은 구글과 달리 아마존은 전자상거래 영업이익이 미미한 상황이므로, 하드웨어 자체의 판매 수익을 높이거나 콘텐츠 및 상거래의 소비를 촉진시킬 수 있는 도구를 확산시켜야 함


아마존은 후자의 전략을 선택했으며 대쉬(dash), 에코 등 새로운 형태의 하드웨어를 선보인 바 있고, 여기에 여타 글로벌 IT 공룡들과 마찬가지로 클라우드 기반 인공지능 기능을 접목한 비즈니스로 새로운 성장 동력을 확보하려는 것으로 보임


페이스북과 구글이 SNS와 모바일을 기반으로 전자상거래 영역을 넓혀가고 있기 때문에, 새로운 성장 동력 확보 필요성은 아마존이 보다 절박하다 할 수 있음


◈ 에코를 스마트폰 시장 이후를 겨냥한 인공지능 기반 스마트홈 허브로 자리매김 한다면, 미국 내에서 초기 시장의 선점은 아마존에 매우 중요한 의미를 갖게 됨


스마트폰 시장의 성장이 정체되고 있기는 하지만, 이는 스마트폰이 이미 사람들의 가장 기본적인 스마트 기기로 자리잡았다는 의미이기도 함


이런 면에서 아이폰을 보유한 애플이나, 새롭게 픽셀(Pixel)이라는 구글폰을 발표한 구글과 비교할 때, 아마존은 스마트폰을 대신할 새로운 기기의 보급이 무엇보다 절실함


아마존이 새로운 형태의 스마트홈 기기로 클라우드 인공지능 기반 스피커 제품을 개발했지만, 스마트홈의 주요 제어 대상은 ​​국가별로 인증 기준이 상이한 백색 가전이나 전기 설비이기 때문에 처음부터 글로벌 전개는 어렵다는 특성이 있음


따라서 아마존이나 구글은 우선 미국 시장 내에서 경쟁할 수밖에 없으며, 이 경쟁 결과가 향후 글로벌 사업에 적지 않은 영향을 미치게 될 것이기에, 아마존은 적극적인 가격 인하 전략을 통해 한 가정 내에 여러 대의 아마존 기기를 들여 놓는데 주력하는 것으로 보임


또한 현재 가장 인기 있는 서비스 중 하나인 음악 스트리밍 서비스나 동영상 서비스를 매우 낮은 가격에 이용할 수 있게 함으로써, 단기간 내에 아마존 AI 기기들의 급속한 보급을 시도하려는 것으로 보임


지금까지 아마존의 하드웨어 사업이 상당한 적자를 감수하면서도 기기 보급에 초점을 두었던 것처럼, AI 기기의 보급에 있어서도 저가 전략은 단기적으로 부담으로 작용할 전망


그러나 스마트폰 시대에는 후발 주자로서 비용을 감수했다면, 지금은 새로운 AI 기반 생태계를 선도적으로 구축하기 위한 투자라는 것이 차이점이며, 성공할 경우 아마존이 기대할 수 있는 결과치를 감안하면 앞으로도 아마존의 파격적인 가격 공세는 지속될 전망


※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1768호(2016. 10. 19 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

구글 모바일 퍼스트에서 AI 퍼스트로.pdf



[ 요 약 ]


구글은 모바일 퍼스트에서 인공지능 퍼스트의 세계로 이행하고 있음을 선언하며인공지능에 기반한 구글 어시스턴트를 기능을 활용할 수 있는 스마트폰, VR 헤드셋스피커 등 여러 새로운 하드웨어 제품을 발표구글의 신제품 발표는 단순히 하드웨어 시장까지 주도권을 장악하겠다는 것이라기 보다하드웨어와 통합되는 소프트웨어의 본질이 인공지능으로 바뀌고 있는 전환점에서 최적의 구글 경험을 소비자에게 전달하기 위한 생태계 구축 전략으로 볼 수 있음




[ 본 문 ]


◈ 구글은 10 4일 신제품 발표회를 가졌는데, 구글의 CEO 순다 피차이는 "구글이 모바일 퍼스트의 세계에서 인공지능 퍼스트(AI First)의 세계로 이행하고 있다"고 선언


<자료> Android Authority


[그림 1] 구글의 인공지능 퍼스트 선언


피차이는 AI 시대 구글의 역할에 대해, 사람들은 이제 모든 곳에서 더 자연스러운 방식으로 컴퓨터와 상호 작용하게 되었으며, 그 모든 사람들을 대상으로 최적화 된 개인용 구글을 제공하는 것이라고 발표


AI가 달성한 최신의 성과 사례로는 이미지를 인식한 후 설명문을 자동 생성하는 이미지 캡션 기능(Image Captioning)을 거론했는데, 2014 89.6%였던 캡션의 정확도가 현재는 93.9%까지 상승했다고 함


피차이는 이에 대해 사진에 찍힌 곰이 몇 마리인지 셀 정도로 개선되었다는 것이라 설명하며, 사람이 직접 캡션을 다는 것과 유사한 정도의 극적인 향상이라고 평가




<자료> Android Authority


[그림 2] AI에 의한 이미지 캡션 품질의 향상


번역 기능의 경우 중국어를 영어로 번역하는 것을 예를 들며, AI가 사람 손으로 번역하는 것에 가까운 수준까지 이르고 있다고 평가했음


또한 텍스트 음성 읽기 기능도 더 자연스러운 발화에 접근했음을 보여 주었음


이러한 AI의 진화는 지난 5Google I/O 2016 컨퍼런스에서 발표한 구글의 인공지능 채팅봇인 구글 어시스턴트(Google Assistant)에 잘 반영되어 있으며, 9 21일 발표한 메신저 앱 알로(Allo)에서 구글 어시스턴트 기능을 이용할 수 있다고 소개


◈ 이어 피차이는 구글 어시스턴트를 보다 잘 활용할 수 있는 2 종류의 기기로 스마트폰과 가정용 스피커의 새로운 모델을 출시한다고 발표


새로운 2개의 기기는 안드로이드 스마트폰 '픽셀(Pixel)' VR 플랫폼 데이드림(Daydream)을 지원하는 헤드셋 데이드림 뷰(Daydream View)


두 기기 중 픽셀 시리즈의 발표에 공을 많이 들였는데, 픽셀 시리즈는 지금까지 구글의 스마트폰이었던 넥서스(Nexus) 시리즈를 대체하는 브랜드가 될 것이라고 함


AI 우선 적용 기기로 스마트폰을 선정한 이유로는 사람들이 갖고 있는 기기 중 가장 중요한 것이 여전히 스마트폰이며, 스마트폰을 통해 1년 동안 촬영되는 사진은 1조 장, 교환되는 메일이나 메시지는 50조 건에 달한다는 점을 언급


픽셀은 특히 구글 어시스턴트, 카메라, VR 등에 중점을 두고 개발했다고 함


◈ 구글은 픽셀 시리즈가 구글 어시스턴트를 탑재한 세계 최초의 스마트폰으로, 사용자들이 음성 명령을 통해 많은 작업을 쉽게 해낼 수 있게 되기를 기대한다고 설명


픽셀 설명을 맡은 제품관리 부사장 브라이언 라코프스키는 실연을 통해 구글 어시스턴트를 이용해 음성 명령으로 구글 포토(Google Photos)에서 사진을 검색하거나, 영화관에서 현재 상영중인 프로그램을 찾는 것을 보여주었음



<자료> Made by Google


[그림 3] 구글 독자 스마트폰 픽셀


• 또한 채팅봇과 상호 작용하면서 적합한 레스토랑을 추천 받고 예약 서비스인 오픈테이블(OpenTable)에서 장소 예약을 하는 데모도 선보였음


• 픽셀의 후면에 탑재된 1,230만 화소 카메라는 DxOMark의 화질 평가에서 89점을 얻었는데이는 스마트폰 사상 최고의 점수라고 어필했으며그 밖에 고속 연사 가운데 베스트 샷을 자동 선택하는 스마트버스트(Smartburst) 등의 촬영 기능을 소개


• 픽셀 스마트폰 소유자에게는 구글 포토에 풀 해상도의 사진과 4K 동영상을 무제한으로 저장할 수 있는 혜택을 제공할 것이라 소개하며더 이상 사진이나 동영상으로 저장 공간의 압박을 받게 될 일은 없을 것이라 어필


• 운영체제는 안드로이드 최신 버전인 7.1 누가(Nougat)가 탑재되며, OS 업데이트는 최고 속도로 제공될 것인데백그라운드에서 업그레이드의 다운로드 및 설치가 실행되고 재부팅 시 새 버전으로 바뀌는 새로운 기능을 지원하기로 했음


• USB 포트는 타입-C를 채택했고, USB-PD(power delivery)에 해당하는 18W AC 어댑터가 딸려 있어, 15분 충전으로 7시간 구동할 수 있는 급속 충전을 지원한다고 함

 제품 라인업은 화면 크기에 따라 5인치 픽셀과 5.5 인치 픽셀 XL2개 모델이며 본체 색상은 블랙/블루/실버의 3가지


화면 해상도는 픽셀이 FHD(1920 × 1080), 픽셀 XL QHD(2560 × 1440)이고, 모두 아몰레드(AMOLED) 디스플레이를 채택하였으며, 배터리 용량은 픽셀이 2770mAh, 픽셀 XL 3450mA


프로세서는 퀄컴의 스냅드래곤 821, 메모리는 4GB, 스토리지는 32기가 바이트 또는 128 기가 바이트 내장이며, 본체 뒷면에는 지문 인증 센서를 탑재하였음


픽셀의 본체 가격은 649 달러로 미국, 호주, 캐나다, 독일, 영국에서는 발표 당일인 10 4일부터, 인도에서는 10 13일부터 예약 주문을 가능하다고 하며, 그 외 다른 국가의 발매 예정에 대해서는 언급하지 않았음


◈ 픽셀은 오랫동안 설로만 떠돈 진정한 구글 폰이 현실화된 것으로 볼 수 있는데, 현 시점에서 구글이 생각하는 스마트 기기의 핵심은 구글 어시스턴트, AI임을 보여 줌


픽셀은 부품 선정부터 공급망 관리, 설계, 제작, 유통 관리까지 모든 것을 구글 독자적으로 진행한 첫 번째 고성능 기기이며, 심지어 액세서리까지 구글 자체적으로 제작


픽셀은 사실 새로운 브랜드는 아니며, 2013년 구글이 넷북인 크롬북 픽셀을 출시하면서 등장한 이름으로, 이후 픽셀은 구글이 독자적으로 설계한 고성능 하드웨어를 대표하는 브랜드로 인식되어 왔음


 기존 넥서스 브랜드가 있음에도 구글이 새로 픽셀 스마트폰을 내놓은 것은, 안드로이드 디바이스 제조업체들과 협력관계를 맺어 생산한 넥서스 제품으로는 구글이 구현하고 싶어하는 사용자 경험을 온전히 구현하기 어렵다고 보았기 때문으로 분석됨


구글이 원하는 것은 구글이 보유한 다양한 서비스를 최적화 해 보여주는 스마트폰일 텐데, 제조사나 통신사들의 이해관계가 반영될 수밖에 없는 안드로이드 폰으로는 애플과 같은 순일한 형태로 구글 경험을 제공하기 어렵다고 보았을 것임


구글은 2012년에 모토롤라를 인수한 바 있지만, 당시 안드로이드 제조업체들과의 관계를 의식해 모토롤라와 타 업체들을 동등하게 대한다는 입장을 발표하였고, 실제 모토롤라를 통해 구글 폰을 구현하지 못하고 2014년에 모토롤라를 재매각한 바 있음


구글은 픽셀에 대해 안드로이드 최고가 아닌 구글 최고의 것이라는 표현을 쓰고 있는데, 이는 픽셀이 구글 내부의 전 역량이 집결된 기기임을 보여주는 것으로 볼 수 있으며, 픽셀 만이 보여줄 구글 경험의 최우선 특징으로 AI 지원을 내세운 것임


◈ 구글 어시스턴트를 활용하는 두 번째 기기로는 구글의 VR 플랫폼 데이드림(Daydream)을 지원하는 VR 헤드셋'데이드림 뷰(Daydream View)를 발표





<자료> Made by Google


[그림 4] 구글 VR 헤드셋 데이드림 뷰(위)와 데이드림 뷰로 본 스트리트 뷰(아래)


• 데이드림 뷰는 픽셀 등 데이드림을 지원하는 안드로이드 스마트폰을 장착하여 사용하는 고글형 장치로 물리적 커넥터 연결은 필요 없음


• 외장은 마이크로 화이버 소재를 채용하여 부드러운 감촉의 착용감을 추구했다고 하며 동봉된 컨트롤러와 함께 사용함


• 다른 단말 제조사가 만든 스마트폰 기기들도 데이드림 플랫폼을 지원하면 함께 사용할 수 있으며본체 색상은 스노우/슬레이트/크림슨의 3가지를 출시


 데이드림을 지원하는 VR 콘텐츠들은 구글 외에도2016년 연내에 50개 이상의 파트너에서 준비해 내놓을 예정이라고 함


구글 서비스 중에는 구글 플레이 무비, 구글 포토, 스트리트 뷰, 유튜브 등이 데이드림을 지원한다고 하며, 발표회에서는 데이드림 뷰를 이용해 스트리트 뷰의 영상을 현장감 있게 즐기는 것을 시연하였음


데이드림 뷰의 가격은 미국에서 79 달러에 판매될 예정이며, 픽셀과 마찬가지로 캐나다, 영국, 독일, 호주에서는 11월에 발매될 예정임


◈ 신제품 발표 행사에서는 구글 어시스턴트를 활용한 제품을 하나 더 선보였는데, 아마존의 에코(echo) 대항하는 제품인 인공지능 스피커 구글 홈(Google Home)


구글 홈 역시 지난 Google I/O 2016 컨퍼런스에서 먼저 컨셉이 공개되었고 이번에 제품 발표가 되었는데, 제품생산 책임자인 리쉬 챈드라가 주요 기능과 특징을 설명



<자료> Made by Google


[그림 5인공지능 스피커 구글 홈


챈드라는 음성 명령을 사용하여 구글 홈에서 음악을 재생하는 데모를 선보였는데, 현재 유튜브 뮤직, 구글 플레이 뮤직 외에 세계 최대 음악 스트리밍 서비스인 스포티파이(Spotify)도 지원한다고 함


구글 홈에 명령하면 개별 곡뿐만 아니라 플레이리스트의 재생도 지원하며, 정확한 곡명을 모르는 경우에도 검색을 통해 음악을 식별해 내는 기능을 지원함


챈드라는 구글 홈을 주방과 거실 등에 배치하면 집안 어디에서나 스마트폰 없이도 구글 어시스턴트를 이용할 수 있게 되는 셈이라고 제품의 의의를 설명


구글 홈은 음악 외에도 뉴스 프로그램과 팟캐스트 등의 재생도 지원하며, 음성 명령으로 사칙 연산과 단위 변환, 날씨나 주가 확인, 스포츠 경기 결과 확인 등 구글 검색의 기능을 호출하여 실생활에서 구글을 보다 잘 활용할 수 있다는 것도 장점으로 제시


아마존 에코와 마찬가지로 구글 홈 역시 스마트 가전을 제어하는 기능이 있어, 필립스와 네스트(Nest), 스마트씽즈(SmartThings), IFTTT 등의 제품과 연계 가능하다고 함



• 음성 명령뿐만 아니라 본체 윗면은 터치 조작도 지원하고 있어 음량 조절 등이 가능하며, 하부는 다양한 색상과 소재로 개인별 선호도에 따른 선택이 가능하고, 가정의 인테리어 등에 맞춰 선택할 수 있게 하였음


구글 홈의 발매 예정은 11월이고, 가격은 129 달러로 아마존 에코(180 달러)에 비해 저렴한데, 여기에 구매 시 광고 없이 동영상을 즐길 수 있는 월 9.99 달러의 유료 서비스 유튜브 레드(YouTube Red) 6개월 사용권도 추가 제공한다고 함


◈ 이번 제품 발표회에서 구글은 AI 기반 하드웨어 외에 와이파이 환경 최적화를 위한 라우터와 동글형 미디어 플레이어인 크롬캐스트(Chromecast)의 신모델도 함께 소개


가정용 와이파이 환경 최적화 라우터인 구글 와이파이(Google Wifi)2015 년에 구글이 발표한 온허브(OnHub)를 진화시킨 제품임


 기존 와이파이 라우터 제품들은 가정의 중심 지점에 모든 방을 커버하려고 했기 때문에 각 방에서 최적의 신호를 얻는 것이 어려웠으나, 구글 와이파이는 여러 대의 라우터를 가정에 배치해 각각 연계함으로써 신호를 최적화한다는 컨셉임


안드로이드 및 iOS 용 관리 앱도 제공하는데, 여러 대의 라우터 중 특정 구글 와이파이 신호를 해제하여 식사 중에는 스마트폰 사용을 그만두게 하는 기능과 라우터에 연결된 장치가 사용하는 대역폭을 확인하고 우선 순위를 설정하는 등의 기능을 지원함



<자료> Made by Google


[그림 6] 와이파이 라우터 구글 와이파이


 미국에서는 11월에 구글 와이파이의 예약 주문을 시작하고 12월에 발매할 예정인데, 가격은 1 129 달러, 3대 패키지는 299 달러라고 함


크롬캐스트의 새로운 모델로는 크롬캐스트 울트라를 발표했는데, 새롭게 4K HDR을 지원함으로써 넷플릭스나 유튜브 등의 4K 콘텐츠를 재생할 수 있게 하였는데, 구글 플레이 무비도 11월에 4K 콘텐츠를 지원할 예정이라고 함


와이파이 성능의 개선으로 동영상의 읽기 속도가 1.8 배 향상되었으며, 새롭게 이더넷 포트를 탑재하여 유선 연결도 지원하게 되었다고 함


크롬캐스트 울트라는 11월 발매 예정이며, 가격은 69 달러로, 현재 35 달러에 판매 중인 크롬캐스트의 약 2배임


<자료> Made by Google


[그림 7미디어 플레이어 크롬캐스트 울트라()


◈ 이번 제품 발표회의 마지막 순서에는 엔지니어링 책임자인 스콧 허프만이 등단해, 구글 어시스턴트 생태계 구축을 위한 구글의 계획에 대해 설명하였음


구글은 앞으로 구글 어시스턴트 파트너 및 개발자들을 대상으로 각종 지원을 아끼지 않음으로써, 구글 어시스턴트를 개방형 생태계로 만들어 가고 싶다는 비전을 제시


 구글 어시스턴트는 다양한 액션(action)’을 이용하여 다른 앱이나 서비스와 상호작용하는데, 간단한 음성 명령인 다이렉트 액션(Direct Actions)’과 로봇과 상호 작용하는데 이용할 수 있는 대화형 액션(Conversation Actions)’ 2 종류 액션을 지원한다고 함


허프만은 12월경에는 보다 많은 액션을 사용할 수 있게 될 전망이며, 개발자들을 위한 SDK 2017년에 제공할 계획이라 밝혔음


◈ 이번 신제품 발표의 핵심은 행사의 시작과 끝에 명확히 드러나 있는데, 이제 구글은 AI의 시대를 주도하고 싶다는 것이며 이를 위한 생태계를 구축하겠다는 것임


이번 행사의 명칭이 메이드 바이 구글(made by Google)이고, 스마트폰을 비롯 라우터까지 하드웨어 제품들이 발표된 것이긴 하지만, 하드웨어 자체 보다는 이와 통합된 소프트웨어에 초점이 맞춰져 있다고 볼 수 있음


순다르 피차이 CEO는 행사 모두에  AI 퍼스트를 제창했으며, 픽셀에서 구글 어시스턴트 기능을 지원한다고 표현한 것이 아니라, 구글 어시스턴트 기능을 이용할 수 있는 기기로서 픽셀을 소개하였음


, 핵심은 구글 어시스턴트로 대표되는 AI 기능에 있다는 것이며, 10년 주기로 컴퓨팅의 주요 흐름이 PC에서 웹 그리고 모바일(스마트폰)로 변했다가, 이제 인공지능으로 옮겨가고 있다는 피차이의 발언에서 구글의 전략을 읽을 수 있음


일각에서는 픽셀의 기능 중 새로운 것이 없으며, 과거 구글이 독자 스마트폰 제조 및 유통에 실패했던 경험과 그 이유를 들어 픽셀도 실패의 전철을 밟게 될 것이라 보지만, 독자적인 하드웨어 유통 자체가 목적이 아닌 만큼 새로운 각도로 볼 필요가 있음


채팅봇 비즈니스는 아마존 에코의 인기에서 보듯 시장성이 검증되어 가고 있기에, 만일 구글 어시스턴트가 그 이상의 퍼포먼스를 보여줄 수 있다면 픽셀과 구글 홈은 인공지능 경험을 원하는 이용자 기반을 창출해 낼 수 있을 것임


서비스 이용 수요를 가진 사용자 기반의 확보는 구글이 가진 하드웨어 유통 상의 약점과 경험 부족을 충분히 상쇄할 수 있는 무기가 될 수 있을 것임


구글의 하드웨어 사업 강화는 단순히 애플의 사업전략을 모방하려는 것이라기 보다, 하드웨어와 통합되는 소프트웨어의 본질이 AI로 바뀌고 있다는 판단에서, AI에 기반한 구글 경험을 이용자들에게 최적의 방식으로 제공하기 위한 시도로 보아야 함


결국 AI 퍼스트를 제창한 구글의 성패는 하드웨어가 아닌 소프트웨어에 대한 소비자들의 만족도에서 판가름 날 것이며, 경쟁자들 보다 얼마나 빠른 시간 안에 개발자와 파트너들을 구글의 인공지능 생태계로 끌어들일 수 있느냐에 따라 좌우될 전망

※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1766호(2016. 10. 05 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

구글 새 메신저 알로 발표 대화형 AI의 비즈니스 가능성.pdf



[ 요 약 ]


구글이 9 21일 인공지능(AI)을 탑재한 메시징 앱 알로(Allo)를 출시하였음알로는 현재 많은 사람들이 사용하고 있는 주류 메신저들과 달리기계학습 기반의 스마트 응답 기능과 구글 어시스턴트(Google Assistant)라는 가상의 비서 기능을 탑재하고 있는 것이 최대 특징가상 비서는 대화형 AI로 사용자와 대화는 물론 사용자 간 대화에도 참여해 도움을 주는데아직 개발 도중에 있지만 대화형 AI가 거대 비즈니스로 성장할 가능성의 단초를 보여주고 있다는 평가




[ 본 문 ]



◈ 그 동안 메신저 서비스에서 번번이 고배를 마셨던 구글이, 이번에는 알로(Allo)듀오(Duo)를 출시하며, 큰 호응을 얻고 있음


구글은 4달 전 구글 I/O 컨퍼런스에서 인공지능에 집중하겠다는 비전을 밝힌 바 있으며, 9월 초순 영상통화 앱인 듀오를 먼저 출시한 데 이어, 9 21일 메신저 앱 알로를 발표하였는데, 두 앱 모두 서비스 초기 큰 호응을 얻고 있음




<자료> Google Play.


[그림 1] 구글 알()와 구글 듀오(아래)


• 구글은 지금까지 구글 토크, 구글 챗, 행아웃 등 다양한 메신저 서비스를 내놨지만 번번이 왓츠앱이나 페이스북 메신저 밀렸는데, 알로와 듀오는 초기단계 관심 모으기에 일단 성공한 모양새


알로의 구글이 사용자들의 의사소통과 표현 방식을 학습하기 위해 인공지능을 활용한 첫 번째 메시지 앱으로, 가장 큰 특징 두 가지는 1)기계학습을 기반으로 한 스마트 응답 기능을 선보인 것과, 2)구글의 음성인식 모듈인 구글 어시스턴트(Google Assistant)를 내장한 것


스마트 응답 기능은 대화 맥락에 맞게 자동으로 여러 가지 답장 내용을 제안하는 것이며, 구글 어시스턴트(Google Assistant) 기능 탑재는 AI 기반의 가상 비서와 대화하거나 가상 비서를 사용자 간의 대화에 참여시키는 기능임


구글플레이 통계에 따르면, 9월말 현재 듀오의 다운로드 수는 1천만~5천만 건 구간에, 알로의 다운로드 수는 1백만~5백만 건 구간으로 표시되어 있음


◈ 알로는 사용자 편의성을 높이기 위해 수신 메시지나 사진의 내용을 이해한 후 자동으로 회신 문장을 생성하는 스마트 응답(Smart Reply) 기능을 갖췄음


메시지 수신 후 실시간으로 Sure, Yes, No 등의 간단한 답변 문장을 생성하여 제시하므로, 직접 입력할 필요 없이 터치만으로 회신할 수 있어 편리한데, 이 스마트 응답 기능은 이미 구글의 메일 앱인 인박스(Inbox)에 적용돼 인기를 모은 검증된 기능임



<자료> Google


[그림 2] 알로의 스마트 응답 기능


• 스마트 응답 기능은 사진 수신 시에도 사용할 수 있는데, 가령 공항에서 촬영한 비행기의 사진을 받으면 알로는 비행기 멋지네(Nice plane), 좋은 여행이 되길(Have a nice flight), 여행 잘 다녀와(Bon voyage!) 등의 응답을 자동 생성함


사진을 이해하고 응답을 생성하는 기능에는 고도의 이미지 인식 기능이 적용되어 있는데, 가령 해바라기 사진을 보고 알로가 멋진 해바라기(Nice sunflower)'라는 답변을 생성한다는 것은 객체가 꽃이라는 것뿐만 아니라 해바라기인 것까지 파악한다는 뜻


사람에게는 쉽지만 기계에는 어려운 것이 이미지 인식인데, 기계가 꽃의 종류까지 판단하려면 고도의 기술이 필요하고 배후에는 신경망이 사용되고 있음


◈ 이미지 인식이 쉽지 않다는 사실은 알로가 아직 음식 사진에 대해서는 구체적 응답을 정확히 제시 못하는 데서도 알 수 있는데, 이는 학습시간의 축적에 의해 해결되어 갈 것


• 가령 알로는 위의 해바라기 경우와 달리 샐러드 사진에 대해서는 맛있겠다(Yummy!)먹어보고 싶다(Wish I could try) 정도의 응답 문장만을 생성하는데이는 알로가 음식이라는 것은 이해하지만 요리의 종류까지는 특정할 수 없음을 반증함



<자료> Google


[그림 3] 꽃 종류 구분 가능, 음식 종류 구분 불가


그러나 구글은 이미지 인식 기술에서 세계 최고 수준의 기술을 보유하고 있으며, 요리의 종류를 인식하는 것이 매우 어려운 것은 아니므로 조만간 음식 구분 기능도 알로에 구현될 것으로 보임


알로는 기계학습을 거듭함으로써 이용자의 표현 방법을 배워 가므로, 데이터가 쌓일수록 이용자의 스타일을 반영한 응답 문장을 만들어 제시할 수 있게 될 것임


◈ 메신저 시장에서 승리하기 위해서는 아무래도 젊은층의 관심을 끌 필요가 있는데, 기존 구글의 제품들과 달리 알로는 표현력이 풍부하고 메시지를 그래피컬하게 보여주고 있음


가령 속삭이기 또는 외치기(Whisper or Shout) 기능은 메시지를 입력한 후 보내기 버튼을 누른 상태에서 슬라이드를 따라 위아래로 움직이며 텍스트의 크기를 변경시킬 수 있는데, 위로 올릴수록 문자나 기호가 커지게 됨


또한 알로는 기본적으로 다수의 스티커를 제공하여 메시지 대신 선택하여 표현할 수 있는 폭을 크게 넓혔음


<자료> beeborn


[그림 4] 구글 알로의 텍스트 크기 조정


◈ 알로의 또 다른 특징은 가상 비서를 메시징에 참여시킨 것으로, 구글 어시스턴트가 이용자들 간의 대화에 개입해 도움을 줄 수 있게 하였음


메신저에 가상 비서를 탑재하려는 시도는 오래 전부터 있어 왔는데, 독립된 계정을 갖고 불특정 다수와 메시지를 주고받는 형태의 가장 최근 사례로는 올해 5월에 인종차별 발언으로 서비스가 중단된 마이크로소프트의 채팅봇 테이(Tay)가 있음


이용자의 가상 비서 역할을 하는 채팅봇은 애플의 시리(Siri)를 거쳐 최근 아마존 에코(Echo)까지 점차 활용이 보편화되고 있는 추세임


이용자가 채팅 메시지 내용을 보고 관련된 내용을 자동으로 보여주는 형태로는 인공지능 메신저 마인드멜드(MindMeld)가 주목을 받고 있음


알로는 시리와 마인드멜드를 합쳐놓은 형태로, 마치 컨시어지 서비스처럼 이용자와 대화하며 도움을 주는 한편, 이용자간 채팅을 보고 있다가 도움이 필요하다고 판단하면 대화에 참여해 조언을 해 줌



<자료> Google


[그림 5] 대화 내용을 이해하고 관련 내용 추천


• 예를 들어 친구에게 이탈리아 요리 먹으러 갈까라고 메시지를 보내면, 어시스턴트가 문맥을 이해하고 근처의 이탈리아 음식점을 소개하는데, 여기에는 구글 지식 그래프(Google Knowledge Graph) 기능이 사용되고 있음


지식 그래프는 다양한 정보원으로부터 축적한 시맨틱 검색 정보를 사용하여 검색 결과를 향상시키는 것으로 구글이 사용하는 지식 베이스(전문가 시스템)


어시스턴트가 소개한 레스토랑 카드를 터치하면 상세 정보가 나타나며 매장 사진 등을 볼 수 있는데, 마음에 들면 그대로 예약 할 수 있으며, 단 레스토랑 예약은 전용 앱인 오픈테이블(OpenTable)을 실행시키고 이 앱에서 예약을 하는 구조임


아직 알로에서 직접 예약할 수는 없지만, 올해 구글, MS, 페이스북이 일제히 제시한 채팅봇 메시징 플랫폼이 구현되면 알로가 예약 앱의 채팅봇과 대화를 하며 예약을 처리하게 되므로, 사용자는 알로에게 예약 요청만 하면 될 것임


알로의 대화 참여는 사용자 간의 대화를 뒤에서 누군가 지켜보고 있는 것 같은 좋지 않은 느낌을 주기도 하지만, 사용해 본 이용자들은 대체로 편리한 기능이라는 평가


◈ 가상 비서는 이용자들 간의 대화에만 적용되는 것이 아니며, 당연히 직접 어시스턴트와 상호작용하며 개인 비서처럼 활용할 수 있음


어시스턴트가 지원할 수 있는 작업 유형은 카드로 제시되는데, 뉴스 구독, 타이머 설정 등을 위한 액션(Action), 게임 등을 위한 재미(Fun), 번역, 날씨, 여행, 스포츠, 질의 응답을 위한 대답(Answer), 어시스턴트의 자기 소개인 마이 어시스턴트 등임



• 가령 여행 카드를 터치하면 여행 관련 정보가 표시되며, 조건을 좁혀 가며 희망하는 항공편이나 도착지의 호텔 검색을 할 수 있는데, 여기서도 항공편 및 호텔 예약은 링크된 웹사이트에서 이루어지며 아직 어시스턴트에서 직접 예약할 수는 없음


어시스턴트는 구글 캘린더와 연동해 이용자의 일정을 파악하고 비서처럼 회의 일정 등 관리하는데, 예약해 놓은 항공편의 정보를 보여줄 수 있고, 다음 일정에 대해서도 알려줄 수 있음



<자료> Google


[그림 6] 구글 어시스턴트와 연동해 일정관리


검색을 지시할 수도 있는데, 가령 개 사진 혹은 강아지 사진이라고 말하거나 입력하면, 구글 이미지 검색 결과를 이용해 원하는 사진을 추천해 줌


◈ 구글의 CEO 순다 피차이는 알로의 가상 비서 기능의 도입에 대해, 지금 현재 구글에서 제일 중요한 순간이라며 큰 의미를 부여


피차이는 ‘단지 웹 링크 하나를 던져놓는 것과는 차원이 다르며, 이 순간을 위해 아주 오랫동안 초석을 다져왔다는 말로 높은 기대감을 표시하고 있음


• 구글 그룹 제품 담당 책임 아밋 풀레이는, ‘사용자들은 친구나 가족과 계속 관계를 유지하기 위한 수단으로 메신저를 사용하지만, 대화가 너무 자주 끊기는 것이 문제라며, ‘대화는 그대로 유지하면서 메신저 내에서 모든 검색과 질문을 해결하는 메신저로 알로를 개발했다고 설명


알로의 메시징 기능들은 사실 참신하다고 할 수는 없지만, 구글 측의 기대대로 구글 어시스턴트를 이용한 대화형 AI라는 인터페이스는 편리하다는 느낌을 준다는 평가


어시스턴트가 구글 검색을 이용할 수 있는 인터페이스를 제공하는 것인데, 어시스턴트의 기능 대부분을 음성으로 이용할 수 있다는 것이 상호작용성을 높이고 있음


구글 음성 검색과 알로의 어시스턴트를 이용하는 것에 내용 상의 차이는 없지만, 바로 이 상호작용성이 큰 차이를 만들어 내게 되는데, 알로는 대화형이므로 검색 결과 제시로 끝나는 것이 아니라 계속 대화가 진행될 수 있다는 데서 여러 가능성이 생김


비록 가상 비서지만 대화 상대라는 인식이 생기면, 사용자는 검색 결과를 보고 추가로 말을 걸거나 추가 요청을 하고 싶은 마음이 생길 수 있으며, 이는 곧 알로의 이용시간이 늘어나며 생활의 새로운 플랫폼으로 부상할 가능성을 획득할 수 있음을 의미


• 순다 피차이 CEO가 지금이 구글에서 제일 중요한 순간이라 말한 것은 이런 맥락일 것이며, 바꿔 말하면 구글에 지금 가장 필요한 것은 알로의 성공이라 할 수 있음


◈ 일각에서는 알로가 유력 메시징 플랫폼으로 부상하며 구글의 AI 비즈니스를 진일보시킬 수도 있겠지만, 프라이버시 이슈 등에 대한 현명한 대처가 전제되어야 한다는 점을 지적


인공지능과 메신저의 결합은 분명 성장 가능성이 가득한 기회의 땅으로 부상할 수 있으나, 알로의 인공지능 기능은 프라이버시를 침해하는 존재가 될 수도 있음


사용자들이 알로에서 인공지능 기능을 활용하려면 구글에 연락처, 대화 내용, 상세한 개인 정보 등의 접근 권한을 허락해야만 하기 때문임


이런 이슈에 대한 대응으로 알로는 보안 옵션을 두고 있는데, 익명 모드(Incognito Mode)를 선택하면 알로의 메시지는 암호화 되며, 또한 스냅챗(SnapChat)처럼 메시지 노출 시간을 10초로 설정해 놓으면 10초 후 메시지가 자동으로 사라짐



<자료> Google


[그림 7] 구글 알로의 익명 모드와 메시지 자폭


메시지 자폭은 스냅챗이 10대들의 인기를 단박에 끌어 모을 수 있었던 핵심 기능으로 주목적은 성적인 대화와 사진 전송 기록이 남지 않도록 하는 것임


알로를 일반 모드로 사용하면 메시지가 암호화되지 않는데, 해시 처리(HTTPS의 프로토콜)에서 최소한의 보안이 제공되기는 하지만 알로는 분명 도청에 약점이 있음


페이스북 메신저 역시 암호화 옵션(비밀 대화)을 지정하지 않으면 메시지가 암호화되지 않는 등 이 문제는 비단 알로 만의 이슈는 아니나, 알로의 경우 메시지를 암호화하게 되면, 알로가 이용자간 대화에 참여하는 핵심 기능을 사용할 수 없는 문제가 발생


◈ 구글은 당초 방침을 바꿔 알로에서 주고 받는 메시지를 장기 보관하기로 결정했는데, 메시징 비즈니스라는 신대륙과 프라이버시 사이에서 고민하는 흔적을 볼 수 있음


구글은 알로에서 주고받는 메시지를 일시적으로 사용할 수 있지만 장기적으로 서버에 보관하는 것은 아니라고 했으나, 이 방침을 바꾸어 메시지 장기 보관 원칙을 밝혔음


보관의 목적은 AI의 교육에 사용할 데이터를 모으기 위함인데, AI를 보다 지능적으로 만들기 위해서는 기계학습이 필요하고, 기계학습을 위한 가장 좋은 교재는 결국 사용자들 간의 대화 내용이므로 장기간 보관을 단행할 수밖에 없었다는 것


이에 대해 당연히 우려의 목소리도 높은데, 전직 CIA NSA 요원인 에드워드 스노우든은 구글이 보관한 메시징 데이터가 범죄 수사 등에 이용될 것을 우려하며, 알로를 사용하지 말 것을 호소하고 있음


알로 역시 스마트 기술의 장점과 프라이버시 침해 기술의 단점을 동시에 지녔기 때문에, 초기의 관심 만을 놓고 알로의 성공이 보장된 것이라고는 말할 수는 없을 것이며 개인정보보호화 스마트 기능 사이의 균형이라는 오래된 숙제를 풀어야 하는 입장


AI 기술의 발전에 따라 인간과 기계의 협업이 새로운 화두로 떠오르고 있는 지금, 알로의 등장은 대화형 AI가 거대 비즈니스로 성장할 가능성의 단초를 보여주고 있음


알로는 현재 미리보기 판(Preview Edition)으로 표시되어 있으며, 사용해 보면 아직 개발 과정 중에 있는 베타 제품이라는 인상이 강하며, 생활의 필수 플랫폼이 될 것이라고 확실히 말하기 어려운 상태


반면 알로는 인간과 기계의 관계라는 측면에서 큰 잠재력을 보여주고 있는데, 특히 어시스턴트와 상호작용 하는 인터페이스에서 온기를 느낀다는 평가가 다수


음성 검색에서 기계적으로 결과를 표시하는 것과 달리, 가상 비서와 말을 주고 받으면서 목적을 달성 할 수 있다는 것은 미래의 모습을 미리 보여주는 것이기도 함


구글이 AI 비즈니스에 전사적 노력을 쏟아 붓고 있고 알로는 그 로드맵의 첫 단추인 만큼 향후 알로의 기능은 보다 정교화 되고 다양해질 것이며, 이는 필연적으로 경쟁 서비스들의 등장을 불러 일으키며, 또 하나의 새로운 비즈니스 영역이 구축될 전망