구글은 올해 CES에서 최초로 자사의 부스를 마련했는데, 스마트 시티와 자율주행차가 테마였던 2018 CES에 구글이 내세운
제품은 인공지능(AI) 기반 스마트 스피커였음
<자료> 9to5 Google
[그림 1] 2018
CES를 뒤덮은 구글의 광고
Ø구글은 라스베이거스 시내와 CES 행사장인 라스베이거스 컨벤션센터(LVCC)를 오가는 모노레일의 외관과 도심 곳곳의 전광판을 구글의 AI 음성
비서인 ‘구글 어시스턴트’를 호출할 때 쓰는 말인 ‘헤이 구글(Hey Google)’로 뒤덮었음
Ø이는 구글이 이번 CES에 부스를 차린 목적이 AI 기반 ‘스마트 스피커’를 홍보하고, 스마트 스피커 시장
점유율 67%를 차지하는 아마존에 도전장을 내밀기 위한 것임을 보여 줌
Ø구글이 작년 10월 출시한 AI 스피커
제품 ‘구글홈 미니(Google Home Mini)’모델은 1월 첫 주까지 총 673만 대 출하되었는데, 이는 11월 말 추수감사절 이후 구글홈 미니 가격을 49달러에서 29달러로 내림에 따라 수요가 급증했기 때문
Ø이와 동시에 12월에는 프리미엄 스마트 스피커를 표방한 ‘구글홈 맥스(Max)’모델을 399달러에 내놨는데, 구글홈 맥스는 식기세척기가 돌아가면 자동으로
볼륨을 높이는 등 주변 환경에 따라 스스로 음량과 음색을 바꾸는 기능을 탑재하고 있음
구글의 스마트 홈 제품 책임자인 마크 스페이츠는 CES의 토크 세션에
참여해 구글 어시스턴트와 스마트 스피커의 과거와 현재, 그리고 미래에 대한 의견을 밝혔음
Ø토크 세션의 제목은 ‘음성 제어: 스마트 홈 경험의 개선’이었는데, 이 토론에는 인텔의 스마트 홈 그룹 제네럴 매니저인 마일즈 킹스턴, 삼성전자의
서비스 및 신규사업 부사장이나 제너럴 매니저인 나나 무루게산 등이 함께 패널로 참석하였음
Ø스페이츠는 스마트 스피커인 구글홈을 개발하기 위해 우선 ‘집을 아는 것’에서부터
시작했다고 말했는데, 스마트 스피커에 무슨 일을 시킬 것인지가 아니라 무슨 기능이 필요한 지를 생각했을
때 개발팀 중 아무도 ‘집’에 대해 제대로 아는 사람이 없다는 것을 깨닫게 되었다고 함
Ø스페이츠는 스마트 스피커가 아직 완성도가 높은 제품이 아니라고 평가했는데, 토론에
참여한 다른 패널들도 아마존닷컴에 이어 구글 등이 잇따라 스마트 스피커를 출시하고 있지만 이 시장은 아직 ‘초기단계’라는 점을 강조하였음.
Ø삼성전자의 무루게산 부사장은 스피커가 ‘이해력(intelligent)’은 있지만 ‘경험에 기반한 현명함(wise)’이 있지는 않다며, 현명해지기 위해서는
인간과 더 많은 관계가 필요하다고 말했음
Ø스마트 스피커와 대화의 시작을 위해 ‘헤이
구글'과 같은 말을 사용하지 않으면 안 되는 것도 아직 어색한 지점이라는 지적도 있었음
패널들 중에는 스마트 스피커가 향후 디스플레이와 조합에 의해 더 발전해 나갈 것이라는 의견을 제시한 사람이 많았음
Ø실제 올해 CES에서는 스마트 디스플레이 관련 기술에 대한 관심이
높았는데, 소니, 삼성전자 산하의 JBL, LG전자, 레노버 등이 구글 어시스턴트를 지원하는 제품을
발표하였음
Ø스페이츠 역시 스마트 스피커를 ‘주방’에 두는 경우를 예로 들며, 음성으로 타이머
기능을 이용하는 것은 좋지만 스피커가 레시피를 음성으로 읽어 주는 방식은 좀 곤란하다고 지적
Ø캘린더 기능에 대해서도, 오늘의 날씨 정도를 듣는 것은 상관 없지만, 스피커가 읽어 주는 모든 일정의 내용을 듣고 있는 것은 고역이라며, 구글
어시스턴트와 디스플레이의 조합을 통해 편의성이 개선될 수 있을 것으로 전망했음
<자료> Digital Trends
[그림 2] 레노버의 스마트 디스플레이
마크 스페이츠가 향후 스마트 스피커의 과제로 제시한 것은 ‘대화 기능’과 ‘다양한 가족 구성원들이 익숙하게 사용하기’임
Ø대화란 어떤 질문에 대해 답하고 그 대답에 반응하여 이야기가 이어지는 것인데,
이런 의미에서 스마트 스피커는 아직 대화를 할 수 있는 수준은 아니라는 게 스페이츠의 의견이며, 질문을
할 경우에만 응답하는 방식의 일방통행적 커뮤니케이션은 아직 대화가 아니라는 평
Ø또 다른 과제로는, 세대와 관심 범위, 기술에 대한 이해도가 각기 다른 가족 구성원들이 어떻게 스마트 스피커 사용에 익숙하게 할 수 있는가를 꼽았음
Ø스페이츠는 ‘어떤 활용 예(Use Case)를 상상하느냐에 달려 있다’고
말하며 두 가지 예를 언급했는데, 첫번째는 구글이 실시한 프로모션 사례로, ‘오케이 구글, 크리스마스 트리에 불을 켜’라고 명령하는 동영상 광고를 내보내자
많은 사람들이 방법을 배워 그대로 따라 했다고 함
Ø이는 어떤 활용 예가 있을 수 있는지 상상해 보고 실제로 보여주는 것이 중요함을 보여주는데, 상상할 수 있으려면 ‘집’에 대해 더 깊이 아는 것이 중요하다고 스페이츠는 지적함
Ø집에 대해 잘 알아야 어떤 상황에 스마트 스피커를 사용하는 것이 좋은 활용사례가 될 수 있는지를 이해할 수 있기
때문인데, 올바른 방법으로 올바른 타이밍에 음성 UI를 사용할
수 있게 된다면 스마트 스피커는 다음 단계로 올라설 수 있을 것임
Ø또 다른 예로는, 나이 드신 어머니와 연락이 되지 않아 무슨 일이
벌어졌는지 걱정한 이후로 모든 방에 구글홈을 설치한 사람의 사례를 들었음
Ø이 사람은 어머니에게 ‘어느 방에서도 노래를 들을 수 있게
하려 그런다’는 식으로 설명했으며, 구글홈의
설정에 뭔가 수정이 발생하면 바로 자신에게 연락이 오도록 해두었다고 함
Ø스페이츠는 아무도 ‘스마트 하우스를 샀다!’는 식으로 말하지 않는다며, 소비자들이 자신의 집에 기술을 접목함으로써
얼마나 편리하게 되는가를 자연스럽게 이해할 수 있도록 하는 것이 향후 스마트 스피커 시장 확대에 기여할 것이라 강조했음
2017년 11월 브라질 리우데자네이루에서는 선진국 거대 기업들이
개발한 인공지능(AI) 서비스가 세계의 일부 지역과 사람들에 불이익을 초래하는 현상에 대한 심포지엄이
열렸음
Ø‘인공지능과 포섭(Artificial Intelligence and Inclusion)’을 주제로 열린 이 심포지엄의 취지는 AI 선진국과
후진국 사이에서 AI 이용에 따른 불평등이 생기지 않도록 하려면 주로 남반구에 위치한 신흥국가 및 저개발국가
사람들이 AI의 영향에 대한 토론에 참여해야 한다는 것
Ø현재 AI 기술의 대부분은 구미를 중심으로 한 ‘AI 선진국’의 가치와 기준에 입각해 개발되고 있기 때문에, AI의 사회적인 영향에 대한 논의도 주로 북반구에 위치한 선진국 중심으로만 이루어지고 있다는 문제 의식에서
출발한 것임
Ø 3일게 걸쳐 열린 이번 심포지엄은 비영리 연구기관인 ‘리우데자네이루 기술과 사회 연구소(ITS Rio)’와 인터넷 사회를 위한 하버드대학 버크맨 센터가 공동 주최하였음
Ø구글, 페이스북 등 주요 IT 기업뿐만
아니라 관련 국제기관, 정책 관계자, 미디어, 인권 문제 활동을 하고 있는 NPO 법인 등 다양한 산업과 연구
분야에서 약 200 명이 참가하였으며, 참가자들은 주제별로 20~50명 규모의 그룹으로 나뉘어 논의하는 세션을 가졌음
[그림] 심포지엄이 열린 리우데자네이루의 '내일의 박물관(Museu do Amanhã)
토론 세션에서는 동일한 기술과 서비스라도 신흥국에서는 원래 의도와 다르게 발현되거나 데이터의 부정확성과 부족으로
인해 정보가 왜곡되는 문제가 주로 제기되었음
Ø리우데자네이루에 거주하는 한 연구자에 따르면, 브라질을 방문한 관광객들
중 지도 앱을 이용하여 목적지까지 최단 경로를 검색해 이동하는 사람 중에는 현지 사람이라면 절대 가지 않는 치안이 나쁜 지역을 통과하게 되어 불행한
일을 당하는 경우가 종종 있다고 함
Ø또 다른 사례는 이미지 검색 서비스에 관한 것인데, 브라질의 한 마을에
과거 학살이 있었고 이 때문에 마을의 이름을 이미지 검색하면 대학살의 이미지 밖에 나오지 않으며, 비록
현재 마을의 양상은 전혀 다름에도 불구하고 정보가 업데이트 되지 않고 있다고 함
Ø위의 두 사례는 치안 정보와 도시 이미지에 관련한 정확하고 올바른 정보가 있다면 기술적으로 해결할 수 있는 것이지만, 세션 토론에서는 그 정보를 누가, 누구에게, 어떤 방법으로 제공할 것인가가 신흥국 특유의 과제로 대두된다는 점이 지적되었음
Ø AI 서비스 제공 기업의 지사가 현지에 없는 경우, 지역 주민들이
올바른 정보를 입력 할 수 있는 기능을 AI 서비스에 추가할 수는 있지만, 신흥국에서는 그 정보가 정말 올바른 것인지를 누가 판단할 수 있는가 하는 문제가 있음
Ø자신에게 유리한 가짜 뉴스를 생성하거나 개인이나 기업에 유리한 정보만 수발신하려는 경향성이 점차 강화되는 상황에서는
정보의 ‘정확함’이나
‘올바름’에
대한 논의도 필요하게 됨
Ø치안이 나쁜 지역의 경로 검색에서도 정보 수집 후 ‘위험 지역 피하기’를
검색 옵션에 추가하면 기술적으로 해결할 수 있긴 하지만, ‘치안이 나쁘다’는
정보를 누가 어디에서 구할 것인가, 업데이트는 얼마나 자주 할 것인가 등의 이슈가 먼저 논의되어야 함
Ø해당 지역의 주민들은 자신이 살고 있는 지역이 ‘위험
구역’이라고 분류되는 것을 싫어할 가능성이 높으며,
그 지역의 비즈니스와 경제 활동에도 악영향을 미칠 수 있기 때문
Ø이러한 기술 이외의 문제는 AI 개발자의 능력만으로는 해결할 수 없으며, 바로 이 지점에서 심포지엄의 주제인 ‘포섭(Inclusion)’이 중요한 키워드가 되는데, 이처럼 포섭은 사회와 경제에서 소외되어 있던 사람들을 끌어 들이고 이들과 서로 협력하려는 사고방식을 배경으로
함
심포지엄에서는 AI 기술의 설계 단계에서 다양한 사람들을 ‘포섭’해야
하고, 소수자를 배제하는 편견을 자각해야 한다는 주장이 다양한 사례와 함께 제기되었음
Ø브라질의 NPO 법인 데사바포 소시알(Desabafo Social)은 검색 엔진의 알고리즘과 학습 데이터가 포섭적이지 않고 편견에 잡혀 있음을 보여주는
영상을 제작하여, 검색 서비스를 제공하는 기업이나 이미지 데이터 제공 기업에 학습 데이터와 알고리즘의
개선을 호소하였음
Ø예를 들어 영어로 ‘Family’를 이미지 검색하면 대부분 앵글로-색슨계의
가족 사진이 표시되며, 만일 아프리카계 가족을 표시하려면 ‘Black’이라는 단어를 검색어에 추가해야 함
<자료> Desabafo Social: Black baby is also baby
[동영상]게티 이미지 검색 서비스에서 ‘Baby’검색 결과와 ‘Black Baby’검색 결과 비교
Ø이러한 문제는 기술적으로는 ‘알고리즘 바이어스(Algorithmic Bias, 편향성)’라 불리지만, 이는 단지 기술로서
해결할 수 있는 문제가 아님
Ø따라서 데이터의 사용과 기술의 설계에는 반드시 ‘문맥(컨텍스트)’과 ‘가치’가 포함되어 있으므로 편향성이 있을 수밖에 없다는 점을 자각하고, 설계 단계에서 여러 사람과 대화하는 과정을 등한시하지 않는 자세를 견지할 필요가 있다는 논의가 이루어졌음
Ø인종, 성별, 성적 소수자
등의 이유로 사회적으로 배제 혹은 차별 받아 온 사람들에 대한 포섭은 인문·사회과학적
관점에서 논의되어 온 주제이며, UN이 내걸고 있는 ‘지속가능한 개발 목표 (SDGs)’라는 의제와도 친화성이 높은 사안임
Ø이 밖에도 ‘데이터에 의한 식민주의(Digital Colonialism)’와
‘WEIRD(Western, Educated,
Industrialized, Rich and Democratic, 즉 서구의 교육 받은 산업화된 부유한 민주국가의 사람들)’등의
용어가 심포지엄에서 거론되었음
한편 AI를 설계하는 단계에서의 포섭 외에, AI가 제공하는 혜택을 폭넓게 즐길 수 있게 해야 한다는 의미의 ‘포섭’에 대한 논의도 함께 이루어졌음
Ø공교육이 충분히 제공되지 않는 신흥국의 참가자들은 AI의 혜택을 모두가
평등하게 누릴 수 있도록, AI 기술을 처리하는 장비와 네트워크 인프라, 그리고 교육 환경을 정비하는 노력이 필요하다고 주장하였음
Ø반면 누구나 AI에 접근할 수 있어
AI의 과실을 누릴 수 있게 된다면, 사회가 프라이버시 보안 등의 위험을 떠맡게 되어 악용될
기회도 늘어날 가능성이 있다는 점이 지적되었음
Ø플랫폼에서 배제된 사람들에 대한 ‘포섭’도 관심을 모은 주제였는데, 가령 중국의
거주자는 페이스북과 구글 등 미국의 플랫폼에 표면적으로 포섭되어 있지 않지만, 포섭되지 않은 사람들
중에는 대안적 플랫폼이 있거나 사용하지 않을 것을 선택할 수 있는 경우가 많음
Ø반면, 원래 플랫폼에서 배제되어 존재조차 감지되지 않은 사람 혹은
특정 플랫폼에 묶여 사실상 탈퇴할 수 없는 사람들이야말로 AI가 제공하는 혜택을 누릴 수 있도록 해야
하고 그 목소리를 설계에 반영시키는 ‘포섭’이 중요하다는 지적이 있었음
Ø이 밖에 흥미로운 논쟁으로는 AI와 로봇을 인간의 파트너로 ‘포섭’하는
것이 올바른 지에 대한 문제 제기도 있었는데, 난민 등 국가의 보호를 받지 못하고 국적조차 인정받지
못한 사람들이 많은 상황에서 AI가 인간의 파트너로 괜찮은지 논의하는 것 자체가 의문이라는 지적이 있었음
Ø이렇게 보면 AI와 포섭에 대한 생각은 사람과 기계, 사회 그리고 환경과 문화의 생태계를 어떻게 설계해 나갈 것인가에 대해 생각하는 것과 다름이 없음
각 세션에서 다양한 논의가 이루어진 가운데, 향후 현재의 문제점 해결을
위한 공통적이고 중요한 작업으로는 ‘교육’이 제시되었음
Ø가령 AI를 이용하는 사용자가 알고리즘 편향성을 발견하더라도 AI를 제공하는 기업은 이런 지적을 수용하지 않을 수 있으므로, 사용자가
스스로 AI 기술을 익혀 대응해야 한다는 의견이 주로 신흥국 참가자들을 중심으로 개진되었음
Ø한편, AI를 설계하는 입장에 있는 엔지니어들에 대해 ‘윤리적인 설계’를
위한 교육 프로그램이 필요하다라는 의견이 나왔는데, 실제로 미국 전기전자학회(IEEE)는 ‘윤리적 조화를 이룬 설계 버전 1.0’을 공개한 후 AI의 윤리적 설계에 관한 교육 프로그램을 만들고 있다고 함
Ø한 연구자는 AI를 설계할 때 ‘AI와 젠더’, ‘AI가 가져올 위협’, ‘AI에 대한 거버넌스’등 3가지를 항상 염두에 두도록 대학에서 학생들을 지도하고 있다고 밝히기도 하였음
Ø국제기구에서 나온 참가자는 편향성이나 권리의 침해에 주의하면서 정보 기술과 데이터의 원활한 이용을 위한 구조를
만들고 이를 사용자들에게 확산시키는 것이 중요하다고 말했음
Ø또한 저작물의 공정한 2차 사용을 허용하는 ‘공정 이용(Fair Use)’이나, 단일 관리기구가 없어도 인터넷을
건전하게 운영하는 인터넷 거버넌스 등 유사 사례를 참조해야 한다고 주장하였음
현재 AI의 거버넌스 구조와 윤리에 대해 세계적으로 다양한 논의가
전개되고 있는데, 남반구에서 제기된 ‘포섭’이라는 개념이 향후 AI 논의에서
중요한 키워드로 포함될 전망
Ø‘포섭’은 모든 것을 같은 규칙과 동일한 기준으로 생각하는 가치의 획일화와는 다르며, 서로의 상황과 가치관의 차이를 인식하고 나아가 불편과 불평등, 불의가
있으면 대화를 통해 어떻게 조정해 나갈 것인가를 생각하며 계속 개선해 나가려는 시도임
Ø AI 기술은 한 걸음 잘못 내디디면 가치의 획일화와 소수자의 배제로 이어질 위험이 있지만, 한편으론 설계자가 편향성을 자각한다면 위험 관리나 새로운 서비스의 개발이라는 관점에서 유용하며, 이 때문에 IT 기업들도 이번 심포지엄에 적극적으로 참여한 것임
Ø대화의 과정을 무시하거나 건너뛰지 않으면 ‘AI와 포섭’은 양립 가능한 것이며, 이런 생각이 ‘인공지능과 포섭(AI and Inclusion)’이라는 이번 심포지엄의 타이틀에 반영되어
있음
Ø이번 심포지엄에서는 신흥국 참가자들이 AI 기술의 선진국에 제기하는
다양한 문제들을 중심으로 논의가 이루어졌으나, 이는 비단 신흥국이나 저개발국가 만의 문제가 아니며, AI 선진국 사이 혹은 각 선진국 내에서도 알고리즘의 편향에 따른 차별과 배제는 엄연히 존재함
Ø남반구가 제기한 ‘AI와
포섭’이라는 주제에 대해 앞으로는 AI 선진국들이
리더십을 갖고 논의를 심화해 나갈 필요성이 있으며, 우리나라도 AI 선진국으로
논의를 주도하는 위치에 오르는 것을 목표로 한다면 이러한 국제적 논의에 적극 참여할 것이 요구된다 하겠음
가상의 스타워즈 캐릭터들을 등장시켜 비디오와 사진을 촬영할 수 있게 해 주는 구글의 증강현실(AR) 앱 ‘AR 스티커’가 큰 인기를 얻고 있음. 지금까지의 AR과 비교할 수 없을 정도로 사실적인 캐릭터를 스마트폰을 통해 생성하고 있는데, 이를 가능케 한 것은 스마트폰 전용 인공지능(AI) 프로세서로 리얼한 AR 구현에 필요한 대규모 연산을 지연 없이 즉각 처리할 수 있음. AI 엔진으로도 사용되는 이 프로세서가 탑재되며 스마트폰이 AI 시스템으로 진화할 것이 보다 명확해지고 있음
[ 본 문 ]
구글의 새로운
증강현실 기술인 ‘ARCore’에 기반을 둔 첫번째 앱 ‘AR Stickers(스티커)’가 2012년 12월 ‘픽셀(Pixel)
2’스마트폰
전용의 카메라 앱으로 투입되었음
Ø 2014년에 구글은 증가현실 기술 ‘프로젝트 탱고(Tango)’를 발표했는데 이 기술은 전용 렌즈를
따로 구비해야 하는 번거로움이 있었고, 그래서 탱고를 지원하는 스마트폰 기기가 레노버의 팹플러스2와 아수스의 젠폰AR 등 극소수에 불과했음
Ø구글이 프로젝트 탱고의 문제로 고민할 즈음 애플은 작년 6월 전용
렌즈 필요 없이 아이폰 만으로 AR을 구현하는 ‘ARKit’기술을 선보였고, 이 방향이 보다 대중적이라 판단한 구글은 얼마 후에 그와 유사한 ‘ARCore’기술을 공개하며 프로젝트 탱고는 2018년 3월 종료한다고 발표
Ø애플에 비해 조금 늦긴 했지만 구글의 AR코어는 발표 당시 큰 기대를
모았는데, 이를 이용한 첫번째 증강현실 앱으로 선보인 ‘AR Stickers’는 기대를 저버리지 않았다는 호평을 이끌어 냈음
Ø이미 많은 스마트폰에서 비디오나 사진을 개체 또는 텍스트와 증강현실로 통합해 주는 AR 앱을 사용할 수 있지만 ‘AR스티커’의 특징은 높은 정밀도로 증강현실을 구현하고 있다는 것으로 현실과 가상 공간의
구분을 없앴다는 평을 받고 있음
AR스티커 앱은 픽셀2 스마트폰의 카메라를 이용하기 때문에, 이용하려면 우선 안드로이드 8.1을 설치하고, 앱 업데이트를 통해 ‘AR코어’와 ‘AR스티커’를 다운로드 받아야 함
Ø다운로드 후 구글 카메라 앱을 사이드 메뉴에 열게 되면 새롭게 추가된 ‘AR Stickers’옵션이 보이는데, 이를 탭한 다음 몇 가지 설정을 해주어야 함
Ø스티커가 나타나게 하고 싶은 평평한 공간으로 카메라 렌즈를 향하게 한 후 스마트폰을 몇 번 회전시키면 카메라가
공간을 분석하게 되는데, 이 공간 인식 과정은 오로지 카메라에만 의존하며 다른 특별한 센서는 필요로
하지 않음
Ø픽셀2 스마트폰이 공간 매핑 작업을 끝내면 스티커를 붙일 수 있는데, 현재 ‘Star
Wars, Stranger Things, Foodmoji, Text, Blocks’의 5가지 팩이 제공되고 있음
<자료> CNET
[그림 1] 픽셀2의 카메라 앱에 추가된 AR Stickers 옵션과 푸드모지(Foodmoji) 캐릭터 추가
Ø스티커 캐릭터를 가져온 다음 아이템에 따라 터치 컨트롤을 이용해 화면에 맞게 크기를 늘리거나 줄일 수 있으며
원하는 공간으로 이동시킬 수 있고, 세팅이 끝나고 나면 비디오 녹화 혹은 사진 촬영을 할 수 있음
Ø AR스티커는 현재 자동 초점(autofocus)이나 탭으로 초점 맞추기(tap-to-focus) 기능은 제공하고고 있지 않으며, 향후 픽셀 1에서도 이용할 수 있게 할 지 여부는 공개되지 않고 있음
AR스티커는 다양한 세트를 제공하고 있지만, 영화 스타워즈 최신 시리즈
‘라스트 제다이(Star Wars: The
Last Jedi)’의 캐릭터들이 가장 큰 인기를 누리고
있음
Ø스타워즈 세트를 선택하면 영화에 등장하는 여러 캐릭터를 비디오에 넣을 수 있는데, 가령 은하 제국군 기동 보병인 ‘스톰트루퍼(Stormtrooper)’를 선택해 비디오에 배치 할 수 있음
Ø촬영을 시작하면 스톰트루퍼가 움직이며 소리를 내는데, 하나가 아니라
여러 스톰트루퍼를 배치할 수도 있으며 각 객체는 독립적으로 움직임을 보이게 되는데, 이들 기동 보병은
매우 사실적으로 묘사되어 있고 움직임이 자연스럽고 부드러워 실제 캐릭터와 분간이 어려움
<자료> TechAcute
[그림 2] 스타워즈
스티커 세트 중 스톰트루퍼를 이용한 AR 비디오
Ø동맹 반군의 전투기인 'X-윙 파이터(X-wing Fighter)’를 선택하면 가변 날개를 X자 모양으로 펼친 상태에서 공중을 호버링하는데, 전투기는 주위 배경의
밝기에 따라 지상에 그림자를 드리우기 때문에 배경과 하나로 합쳐져 가상 이미지라는 느낌을 전혀 주지 않음
<자료> TechAcute
[그림 2] 스타워즈 스티커 세트 중 X-윙 파이터를 이용한 AR 비디오
Ø여러 캐릭터를 동시에 조합하여 사용할 수도 있는데, 눈사람 모양의
로봇 ‘BB-8’을 선택하면 화면 가운데에서 데굴데굴 움직이며, 여기에 스톰트루퍼를 추가하면 두 캐릭터가 고유의 움직임을 보이다가 서로 마주하게 되면 서로 커뮤니케이션을 하기
시작함
Ø‘TIE
Fighter’를 선택하면 쌍발 이온 엔진(Twin Ion Engines)으로 비행하는 전투기가 등장하게 되며, 전투기는
이온 엔진 특유의 소리를 내며 비행하고 때때로 레이저 캐논으로 공격을 가함
Ø TIE Fighter에 접근해 근접 촬영을 해보면 전투기 세부까지 극명하게 묘사되어 있음을 알 수 있는데, 기체에 난 손상 흔적이나 모서리의 마모 등이 매우 리얼하게 표현되어 있어 마치 모형을 촬영하고 있는 듯한 느낌을
주며, 이것이 가상의 객체라는 사실이 놀라움을 주고 있음
AR스티커는 구글의 AR 앱 개발 플랫폼인 AR코어를 통해 개발되었으며, 구글은 AR코어를 공개하고 있기 때문에, 파트너들도 개발 환경을 이용해 AR 앱을 개발할 수 있음
Ø AR코어가 작년 8월 말에 공개되었기 때문에 현재 이 개발환경을 지원하는
기기는 구글의 픽셀과 픽셀2 및 삼성전자 갤럭시 S8뿐이지만, 올해 출시될 중고사양 안드로이드 스마트폰들은 대부분 AR코어를 지원할
것으로 전망
Ø따라서 조만간 AR스티커 앱에도 더 많은 팩이 개발되어 제공될 것을
예상해 볼 수 있으며, 스티커 외에 게임, 교육, 커뮤니케이션 등의 분야에서 더 재미있고 참신한 AR 앱들이 속속
선보이며 AR의 대중화를 앞당길 것으로 보임
가상의 콘텐츠를 현실 세계와 통합하는 증강현실을 완벽히 구현하기 위해 구글의
AR코어 플랫폼은 3가지 모듈의 완성도를 높이는 데 주안점을 두고 있음
Ø‘동작 추적(Motion Tracking)’모듈은
현실 세계 속에서 AR 콘텐츠의 위치를 파악하고 스마트 폰으로 콘텐츠를 추적하는 ‘캐릭터의 위치 결정’기술임
Ø카메라의 움직임에 따라 AR코어는 ‘COM(Concurrent
Odometry and Mapping, 동시 이동거리측정
및 매핑) 프로세스’를 실행하여 카메라의 위치 관계를 파악하는데, 이미지 안의 특징 포인트 (Feature Point)를 파악해 이들이 어떻게 변하는지 추적하여 공간에서 카메라의 위치를 파악함
Ø AR코어는 특징 포인트의 움직임과
스마트폰의 가속도계 데이터를 결합하여 카메라의 위치와 카메라의 방향을 뜻하는 ‘포즈(Pose)’를 파악하는데, GPS 등의
위치 정보가 없어도 AR코어는 핀 포인트로 위치 파악이 가능함
[그림 3] 증강현실 구현을 위한 AR코어의 3대 모듈 중 동작 추적
Ø‘환경 이해(Environmental Understanding)’모듈은 현실 세계에서 평평한 부분을 감지하고 그 위치와 크기를 파악하는
기술인데, 평평한 부분은 특징 포인트가 공통적으로 수평면을 가지고 있기 때문에 ‘플레인(Plane)’이라 부르며 테이블이나 바닥 등이 대표적 플레인이 됨
Ø AR코어는 플레인의 경계를 파악하게 되는데, 이 정보가 앱에 전달되어
캐릭터가 설 수 있는 장소와 그 범위를 파악할 수 있음
[그림 3] 증강현실 구현을 위한 AR코어의 3대 모듈 중환경 이해
Ø‘밝기 측정(Light Estimate)’모듈은
현실 세계의 빛의 상태를 파악하는 기술인데, 카메라에 포착된 개체의 평균적인 빛의 강도를 파악하게 됨
Ø이 밝기 정보를 앱에 전달하여 생성하는 객체를 그와 동일한 밝기로 만들기 때문에, 이런 방식을 통해 생성된 객체는 생생함을 얻게 되고 배경 이미지와 어울리게 됨
<자료> Google
[그림 3] 증강현실 구현을 위한 AR코어의 3대 모듈 중밝기 측정
Ø이상의 3개 모듈을 통해 현실 세계를 이해할 수 있게 되면 AR코어는 가상의 객체를 생성하여 이를 현실세계와 통합하는데, 개체는
현실 세계에 적합한 자연스러운 형태로 배치됨
Ø AR코어가 주변 상황을 파악하고 있기 때문에 이용자는 포즈를 바꿀 수 있으며 카메라를 움직여 객체의 주위를 돌면서
혹은 다른 방향에서 촬영할 수 있는데, 가령 X-윙 파이터
주위를 돌며 뒤에서 촬영해도 전투기는 공중에서 호버링 하며 닻으로 고정된 것처럼 그 자리에 머묾
이처럼 픽셀2에서 AR코어를
통해 고급 AR 처리를 실행할 수 있는 것은 픽셀2가 이미지
처리 및 기계학습용 전용 프로세서, 즉 AI 프로세서를 탑재하고
있기 때문임
Ø픽셀2는 ‘픽셀 비주얼 코어(Pixel Visual Core)’라는 인공지능(AI) 전용 프로세서를
탑재하고 있는데, AR코어는 픽셀 비주얼 코어에서 처리되며 초당 60
프레임을 생성하기 때문에 정밀한 이미지를 만들어 낼 수 있음
Ø그 결과 세부 디테일까지 상세하게 묘사된 가상의 캐릭터가 이미지 처리 지연 시간 없이 비디오 속에서 자연스럽게
움직임을 보일 수 있고 실물 객체와 분간 할 수 없게 되는 것임
Ø AR 앱 적용에 앞서 픽셀 비주얼 코어 프로세서는 사진 촬영이나 AI 기능에
사용되었는데, 픽셀2의 카메라 앱은 ‘HDR+’라는 기능을 가지고 있으며 다이내믹 레인지의 넓은 사진을 촬영할 수 있고, 이미지 처리에 대량의 연산이 발생하지만 이를 픽셀 비주얼 코어에서 빠르게 처리함
Ø가령 교회 안에서 희미한 제단을 HDR+ 기능으로 촬영하면 조명을
비춘 것처럼 생생하게 담을 수 있는데, 지금까지는 HDR+ 처리에
시간이 걸리고 많은 전력을 소비했지만 픽셀 비주얼 코어를 탑재해고 있어 이런 작업을 즉각 실행할 수 있음
<자료> ITPro
[그림 5] AI 프로세서로 처리한 픽셀2의 HDR+
Ø픽셀 비주얼 코어는 구글이 설계한 프로세서로 픽셀2 스마트폰의 가속기로
자리매김 되고 있는데, 픽셀2의 메인 프로세서는 퀄컴 스냅드래곤 835이지만 이미지 처리 및 기계학습 실행 시에는 픽셀 비주얼 코어로 작업을 이관하게 됨
Ø픽셀 비주얼 코어의 개발 환경을 보면, 이미지 처리에서는 이미지 처리용
프로그래밍 언어 ‘할라이드(Halide)’를 지원하며, 기계학습에서는 딥러닝용 오픈소스 소프트웨어 ‘텐서플로우
라이트(TensorFlow Lite)’를
지원함
Ø픽셀 비주얼 코어는 안드로이드 8.1 오레오(Oreo)부터 사용할 수 있는데, 즉 픽셀2에는 이미 픽셀 비주얼 코어가 탑재되어 있었지만 오레오가 공개된 작년 12월부터
이 프로세서를 사용할 수 있게 된 것이며, 오레오 런치와 함께 AR스티커에서
스타워즈 세트도 제공되기 시작한 것
구글은 안드로이드 8.1을 공개하며 기계학습을 위한 API인 ‘신경망 API(Neural Networks API)’를
공개했는데, 이는 스마트폰이 AI 시스템으로 진화되어 갈
것임을 시사
Ø개발자들은 신경망 API를 이용해 기계학습 기능을 응용 프로그램에 통합 할 수 있게 되었는데, 신경망 API는 픽셀 비주얼 코어 외에도 GPU 등 프로세서도 지원하고 있음
Ø텐서플로우 라이트는 경량의 AI 개발 환경에서 교육된 AI 앱을 스마트폰에서 처리하기 위해 사용되는데, 파트너들이 안드로이드용 AI 앱을 개발하고 있어 조만간 스마트폰에서
실시간으로 구동되는 AI의 등장이 기대되고 있음
스마트폰의 AI 프로세서를 통해 현실과 구분하기 어려운 가상의 객체들이 AR로 통합됨에 따라 2018년은 이전과 차원이 다른 AR이 새로운 콘텐츠 미디어로 급부상할 것으로 전망
Ø구글은 작년 연말부터 스타워즈를
모티브로 한 AR스티커를 텔레비전 방송으로 광고하고 있으며 미국에서 상당한 화제를 모으고 있음
Ø AR스티커의 사회문화적 파급력 역시 결코 작지 않을 것을 예상해 볼 수 있는데,
리얼한 가상 객체를 스마트폰에서 생성할 수 있게 됨에 따라, 지금까지 전문가들의 영역이었던
특수 촬영이 픽셀2를 통해 대중화할 수 있는 계기를 마련했기 때문
Ø인공지능의 발전에 따라 점점 더 현실과 구분하기 어려운 가상 객체들을 손쉽게 만들 수 있게 되었으며, 이를 스마트폰을 통해 이용할 수 있는 환경이 도래함에 따라 현실과 가상의 세계 구분이 어려운 새로운 콘텐츠
공간이 열리게 되었음
Ø픽셀2가 보여 준 스타워즈 AR스티커는
포켓몬GO를 통해 대중화된 지금까지의 증강현실 개념을 뛰어넘은 것으로,
현실과 가상을 넘나드는 새로운 앱의 출현을 기대하는 만드는 동시에 점점 더 구분하기 어려운 가짜 뉴스의 확산 등 적잖은 부작용에 대한
우려도 낳고 있음
원래 이 블로그는 제가 <주간기술동향>이라는 주간지의 '최신ICT이슈'라는 꼭지에 기고한 글을 개인적으로 아카이빙 하는 공간으로 개설한 곳입니다. 주간지를 발간하는 정보통신기술진흥센터의 웹사이트에 가도 PDF 버전이 잘 아카이빙 되어 있기는 하지만, <주간기술동향>은 책자로 인쇄해 배포되는 잡지이다 보니 원고 작성 시에 동영상 등 멀티미디어 활용에 제한이 있습니다. 그래서 원고에는 담지 못한, 혹은 캡처 화면으로만 소개된 동영상을 넣은 온라인 버전의 아카이빙이 있으면 좋겠다 싶어, 티스토리에 공간을 빌리게 되었습니다.
개인적인 아카이빙이 목적이다 보니.. 일주일에 한번 썼던 글 카피해서 올리는게 다여서 블로그는 사실 운영이랄 것도 없고 별다른 신경을 못쓰고 있습니다만.. 티스토리 관리자 화면이 개편되면서 방문자 수를 강제적으로 보게 되는데, 월에 3천분 정도, 그러니까 하루에 100분 정도가 들러주시는 것 같습니다. 어떤 경로로든 방문해 주신 분들께는 감사의 말씀드리며, 위에서 말씀드린 것과 같이 개인 목적 운영이기 때문에 보시기에 불친절한 면이 있었더라도 양해해 주시길 바랍니다.
이 곳에 아카이빙 하는 글들이 '최신ICT이슈'라는 타이틀을 달고 있긴 하지만, 블로그 들러서 글을 보신 분들 중에는 최신 이슈가 맞는지, 그리고 이게 중요한 이슈인지 등에 대해 의구심을 갖는 분들도 계실 것 같습니다. <주간기술동향>은 인쇄 발행물이다 보니 원고가 최소 1주일 이전에 마감되어야 하고, 몇년 전에는 2주 전에 마감하기도 했습니다. 그러다보니 원고 작성 시점에는 뉴스가 되더라도 2주 후에는 전혀 새롭거나 가치 있는 소식이 되질 못하는 일이 다반사였습니다. 그래서 제 나름대로 찾은 방법이 국내 미디어에는 잘 소개되지 않는 뉴스, 소개되더라도 자세히 소개되지 않는 뉴스들을 다루는 것이었는데요.. 최근 정보 매체들의 수가 더 급증하면서 이 방법도 점점 더 유효하지 않게 되어 가고 있습니다. 해가 갈수록 원고 아이템 찾는 일이 어려워지고.. 나이도 먹어가기 때문에, 얼마나 더 할 수 있을 지는 모르겠습니다. ^^
아무튼.. <주간기술동향>은 1월 3주차부터 1년에 50회 발간이 되고, '최신ICT이슈' 꼭지에 제가 보통 3개의 뉴스를 기고하니 올해도 150개 소식을 전달한 셈인데요..
올해 썼던 글 목록을 보면서.. 재미 삼아 제 스스로 기억에 남았던 글들 10개를 뽑아 봤습니다. 제 기준에 따라 제 맘대로 뽑은 것이고.. 또 순위가 중요도를 의미하는 것 같지도 않습니다. 관심을 가지고 본다면 어느 것 하나 중요하지 않은 것이 없겠죠.
어느 곳에서 어떤 생각을 갖고 살아가시는 분들이건, 제 블로그를 방문해 주셨던 모든 분들께 깊은 감사의 말씀 드리며, 운칠복삼의 2018년이 되길 열렬히 기원합니다. 새해 복 많이 받으십시다들.
스마트폰 쓰듯이 누구나 인공지능을 쓸 수 있는 시대가 올 수도 있겠구나 하는 생각이 들었던 기사. 구글이 "Don't be evil" 이라는 창업 이념을 잊고 있는 것 같지는 않은 것 같다는 느낌도 받았던 듯.
3. ‘ICO’, 블록체인 혁명을 위한 새로운 자금조달기법 혹은 묻지마 (☞ 바로가기 클릭)
8월 말에 작성한 이 기사 내용 중에 비트코인 가격 4천 달러 돌파 소식도 들어 있었는데.. ㅎㅎ 돈이 없어 그런가 나는 왜 살 생각을 못했던가. ㅠㅠ
비트코인이 금을 대체할 수 있는지 등등은 어차피 보이지 않는 국제금융의 큰 손들이 결정할 일이니 이렇다 저렇다 말할 수 없는 일이고.. ICO를 하려면 우선 비즈니스모델이 있어야 한다는 기사의 지적은 합당한 듯. 정부가 ICO 막는다고 뭐라 하기 전에 ICO로 코인 모아서 뭘 하려는지부터 명확히 설명할 수 있어야 할 것임.
올해 양자컴퓨터 관련 소식을 나름 시리즈로 다루었다. IBM, 구글, MS의 양자 컴퓨팅 연구개발 상황을 3주 연속으로 다루었는데.. 개발업체들 관점에서 나온 소스들을 정리하다 보니 긍정적 톤이 나오게 되었다
연말에 Q2B Conference라는 행사가 있었고, 여기에 제조 금융 서비스 기업들이 나와 양자 컴퓨팅 도입 방안과 미래에 대해 전망하였는데, 개발업체들에게는 미안한 말이지만 양자 컴퓨터의 현재 수준을 알 수 있어 좋았다.
지금은 아직 멀었다는 평이지만.. 어차피 기술은 급속히 발전하는 것이니 내년에는 또 뭐가 어떻게 바뀔 지 기대.
5. 완전 자율주행 무인 택시 ‘웨이모’의 안전성 확보를 위한 여러 노력들 (☞ 바로가기 클릭)
자율주행차 소식도 여러 건 다루었는데, 실제 상용화를 이루기 위한 구글의 구체적 노력을 알 수 있어 좋았던 기사. 국내 금융기관도 이미 대출 승인할 때 AI를 이용하고 있다는데, 결과적으로 보면 AI의 판단이 옳은데 문제는 대출 거부된 사람에게 그 이유를 명확히 설명해 주지 못한다는 것. 자율운전차도 경로 결정을 AI에 맡기면 결과적으로는 사람보다 더 잘할 수는 있겠으나, 사고 발생시 무조건 상대방 차량의 사람에게 과실을 물어야 하냐는 현실적 문제가 발생하는데, 그런 문제를 해결해 나가려는 구글의 모습에서 자율주행차는 상용화가 진짜 몇 년 안 남았다는 느낌.
6. DNA 분석 결과, 백인우월주의자 대부분은 ‘순수 백인’이 아닌 걸로 (☞ 바로가기 클릭)
DNA 분석 서비스 비용이 낮아져 보편화되면 이를 통해 사람들의 고정관념과 아집이 허물어질 수도 있겠다는 생각을 해준 기사. 점차 다문화 사회가 되어 가고 있고, 서구인에 대한 무조건적인 친절, 아시아, 아프리카인에 대한 근거 없는 우월감을 보이는 우리나라에도 꼭 필요한 서비스라는 생각.
7. 위성사진 분석으로 경제 정보 제공, 투자자들이 주목하는 AI 스타트업 (☞ 바로가기 클릭)
AI가 못하는 창의적인 일을 하라는 것도 이제는 헛소리. AI가 사람보다 예술도 더 잘하고, 심지어 AI 개발도 AI가 하고 있으니까. 결국 남는 건 운동선수가 되는 일인데, 이것도 얼마나 유효할 지는 모르겠다. 백 덤블링하는 로봇도 나왔으니.
데이터 사이언티스트의 가장 중요한 덕목은 분석 툴을 잘 다루는 것이 아니라 '인사이트'라고 하는데, 과연 그렇겠구나 하는 걸 실감하게 해준 뉴스. 결국 남이 못보는 것을 잘 보는 것이 살아남는 방법.
한때 한국 기업 구조조정의 바이블이었던 GE의 인사 제도가 디지털 혁명 시대를 맞이하여 GE 스스로에 의해 폐기되고 있다. 그래도 아직 한국의 어느 기업들 중에는 잭 웰치의 말을 여전히 신봉하며 어떻게 직원을 정리해야 할 지에 대해서만 골몰하는 곳도 있겠지.
9. 기후 변화로 손실 위험 높아지는 보험회사, IoT로 위험 극복 노력 (☞ 바로가기 클릭)
디지털이 야기하는 파괴적 혁신에 기업들이 어떻게 대처해야 하는지가 전통적 비즈니스들의 생존 과제임을 다시 한번 느끼게 해준 기사. 한국 기업들도 나름 잘 준비하고 있으리라.
위의 기사와 쌍을 이루는 뉴스로는.. "치매 발병률 검사 후 간병보험 가입, 보험회사 위협하는 DNA 분석(☞ 클릭)"이 있었다.
10. ‘엣지 컴퓨팅’으로 AI 기능 구현한 소형 장난감 로봇 ‘코즈모(Cozmo)’ (☞ 바로가기 클릭)
앞으로는 스마트폰이 클라이언트가 아니라 미들웨어와 서버로 더 많이 활용될 것임을 느끼게 해 준 뉴스. 스마트폰 사양이 더욱 좋아져야 할 이유가 생긴 듯. 이 뉴스와 같은 맥락의 기억에 남는 기사는.. "아이폰과 연결해 사용하는 휴대형 초음파 진단 장비, 암 진단 성공(☞클릭)"
12월 초 실리콘밸리에서 개최된 ‘Q2B
컨퍼런스’에서는 자동차, 금융, 항공산업의 기업들이 등단해 양자 컴퓨터를 자신들의 비즈니스에
어떻게 활용할 것인지 소개하였음
Ø실리콘밸리에 있는 미 항공우주국(NASA)의 에임스 연구 센터에서
개최된 Q2B 컨퍼런스는 양자 컴퓨터용 소프트웨어 개발 스타트업인 ‘QC웨어(QC
Ware)’와 NASA가
공동으로 개최했으며, 양자 컴퓨터의 비즈니스 활용을 주제로 발표와 토론이 펼쳐졌음
Ø미국과 유럽에서는 전통 있는 유력 기업들이 양자 컴퓨터의 비즈니스 활용을 본격적으로 검토하기 시작했는데, 폴크스바겐, 골드만삭스, 에어버스가
대표적으로, 이들은 'Q2B 컨퍼런스’에 등장해 각 기업이 양자 컴퓨터에 대해 갖고 있는 기대를 설명하였음
Ø지금까지 양자 컴퓨터에 대한 논의는 거의 학회 형식으로 개최되었고 등단자나 참관객 모두 이 분야의 연구자인 경우가
대부분이었으며, 이번 Q2B 컨퍼런스처럼 비즈니스 색채가
강하고 기업이 강연까지 직접 맡는 경우는 매우 드물었음
Ø이런 점에서 이번 Q2B 컨퍼런스는 미국과 유럽에서는 이미 양자 컴퓨터가
연구 단계에서 산업 단계로 이행하고 있음을 보여주는 하나의 이정표로서 의의가 있으며, 이번 컨퍼런스에서
다루어진 논지는 향후 기업에서 양자 컴퓨팅 활용을 고민할 때 참조가 될 수 있을 것으로 보임
폴크스바겐은 양자 컴퓨터를 비즈니스에 가장 먼저 활용하는 기업이 되기 위해, 양자
컴퓨터의 개념과 연산 능력을 직접 검증하고 있음
Ø컨퍼런스에 등단한 폴크스바겐의 마틴 호프만 CIO(최고정보책임자)는 현재 2종류의 양자 컴퓨터를 실제 사용하며 검증과 알고리즘 개발을
진행하고 있다고 소개
Ø하나는 캐나다 D-웨이브 시스템이 만든 양자 어닐링 방식의 양자 컴퓨터 'D-Wave 2000Q' 모델로 폴크스바겐은 올해 3월 검증 결과를
발표한 바 있음
Ø또 하나는 구글에서 개발을 진행 중인 양자 게이트 방식의 양자 컴퓨터로 폴크스바겐과 구글은 지난 11월에 양자 컴퓨터용 알고리즘 개발을 주 내용으로 한 제휴를 발표하였음
Ø폴크스바겐에 따르면 D-웨이브의 양자 어닐링 방식으로 기존 컴퓨터에서는
절대로 도달할 수 없는 계산 능력이 실현될 수 있을지 여부는 아직 알 수 없음
Ø구글의 양자 게이트 방식에 대해서도, 구글이 기존 컴퓨터에서 실현
불가능한 계산 능력이 있음을 나타내는 ‘양자 초월성(Quantum Supremacy)’을 입증하고 있지만 현 시점에서 그와
같은 하드웨어는 아직 존재하지 않는다고 말하고 있음
Ø현재 양자 컴퓨터에 대해 명확하게 단언할 수 있는 상황이 아님에도 폴크스바겐이 검증을 시작한 이유에 대해, 마틴 호프만 CIO는 양자 컴퓨터가 상용화되었을 때 그것을 가능한
한 빨리 업무에 활용한 기업이 되고 싶기 때문이라 설명
폴크스바겐은 구체적으로 도시 교통 서비스의 이동 경로 최적화와 전기자동차용 고성능 배터리 개발에 양자 컴퓨터를
적용할 수 있을 것으로 기대하고 있음
Ø호프만 CIO는 D-웨이브
시스템의 적응 영역으로 도시 교통 서비스의 이동 경로 최적화를 꼽았는데, 폴크스바겐이 계획하고 있는
주문형 모빌리티 서비스를 제공할 때 차량의 이동 경로를 양자 컴퓨터를 이용해 고속으로 최적화할 수 있을 지에 대해 검증하고 있다고 함
<자료> Startup Times
[그림 1] 폴크스바겐의
양자 컴퓨터 활용 예
Ø도시의 이동 수요를 예측하는 알고리즘은 기존의 컴퓨터를 이용한 기계학습에 의해서도 개발되고 있지만, 이동 수요에 따른 공급을 실현하기 위해 차량이 어떤 경로를 어느 정도의 속도로 달리게 할 것인가 하는 문제를
양자 컴퓨터를 이용해 해결하려는 것임
Ø즉 기존 방식으로 불가능한 것은 아니나 ‘양자
컴퓨터를 통한 보다 향상된 최적화(Quantum Enhanced Optimization)’를 실현하려는 것이 폴크스바겐의 목적임
Ø한편 구글의 양자 게이트 방식은 화학 시뮬레이션에 활용될 것으로 기대한다는 입장인데, 11월에 폴크스바겐은 보도자료를 통해, ‘전기자동차용 고성능 배터리 개발’등에 양자 컴퓨터를 사용한 화학 시뮬레이션을
기대할 수 있을 것 같다고 발표한 바 있음
Ø Q2B 컨퍼런스에 등단한 알파벳의 벤처캐피탈 부문인 구글벤처스는 화학 시뮬레이션의 속도를 높일 수 있는 양자
컴퓨터가 6~9년 후에 상용화 될 것으로 예측했는데, 폴크스바겐은
양자 컴퓨터를 이용한 화학 시뮬레이션의 가속화를 겨냥해 구글과 공동 연구를 시작한 것으로 보임
이어 등단한 골드만삭스는 자신들이 양자 컴퓨터에 관심을 갖게 된 계기는 범용 양자 컴퓨터에 의해 기존 공개키
암호 방식이 깨질 수 있다는 우려를 접했기 때문이라고 밝혔음
Ø범용 양자 컴퓨터는 거대한 수의 소인수분해를 할 수 있다고 알려져 있어 현재의 암호 체계가 깨질 수 있고, 그에 따라 고객 정보가 유출될 수 있다는 경고가 제기되어 온 바 있음
Ø그러나 골드만삭스 연구개발 부문의 폴 버샤드에 따르면, 큰 수의 소인수분해가
가능한 범용 양자 컴퓨터의 실현은 먼 미래의 일로 판단하고 있으며, 오히려 현재 골드만삭스는 양자 컴퓨터를
이용한 ‘몬테카를로 시뮬레이션'의 고속화
등에 관심을 갖고 있다고 함
Ø몬테카를로 시뮬레이션은 수 많은 경우의 수를 연산하는 방법으로 금융 기관의 리스크 계산 등에서 빠뜨릴 수 없는
기법인데, 현재 골드만삭스는 몬테카를로 시뮬레이션을 위해 엄청난 규모의 수퍼 컴퓨터를 투입하고 있어
이를 양자 컴퓨터로 대체하는 방안을 모색 중이라는 것
에어버스 역시 항공기 설계나 고장 원인 분석을 위해 사용되고 있는 수퍼 컴퓨터를 보완할 수 있는 가능성 모색을
위해 양자 컴퓨터의 검증을 진행 중이라고 밝혔음
Ø에어버스 연구개발 부문의 티에리 보터에 따르면, 에어버스는 항공기의
설계를 지원하기 위해 엄청난 양의 시뮬레이션을 수퍼 컴퓨터에서 실행하고 있으며 IT 예산의 3%가 이와 관련한 하드웨어에 투자되고 있다고 함
Ø따라서 에어버스는 수퍼 컴퓨터를 보완하는 기술을 지속적으로 필요로 하고 있으며,
에어버스의 기존 응용프로그램을 수퍼 컴퓨터보다 빠르게 풀 수 있기만 하다면 그것이 어느 메이커든 어떤 방식이든 상관없으며, 양자 역학에 근거하고 있는지 여부도 상관하지 않는다고 함
Ø에어버스가 양자 컴퓨터의 적용 영역으로 기대하는 것은 ‘결함 트리 분석(Fault Tree Analysis)’의 속도인데, 이 분석 기법은 항공기
고장 원인 등을 분석하는데 사용되지만, 규모가 큰 경우의 분석은 매우 어려운 문제이며 수퍼 컴퓨터로
해결하는 것도 불가능 하다고 함
Ø에어버스는 QC웨어가 개발한 소프트웨어와 D-웨이브의 양자 어닐링 방식을 사용하여 결함 트리 분석을 수행할 수 있는지 검증했는데, 에어버스가 요구하는 규모의 결함 분석을 D-웨이브의 머신으로 푸는
것은 애초부터 기대하지 않았지만 몇 가지 흥미로운 검증 결과를 얻었다고 함
Ø보터에 따르면 기존 컴퓨터와 달리 D-웨이브의 머신을 사용하는 경우
문제의 크기가 바뀌어도 문제를 푸는 데 걸리는 시간이 더 길어지지 않고 동일했는데, 이를 통해 기존
컴퓨터와 전혀 다른 원리로 작동하는 D-웨이브 시스템의 특이성을 재차 확인할 수 있었음
Ø에어버스는 앞으로 D-웨이브 시스템의 양자 컴퓨터와 수퍼 컴퓨터를
조합하여 결함 트리 분석을 효율적으로 수행하는 방법 등을 검증해 나갈 계획이라고 함
아마존웹서비스 리인벤트 컨퍼런스에서는 아마존의 인공지능 가상 비서 ‘알렉사(Alexa)’와 관련한 두 가지 흥미로운 발표가 있었음. 하나는 알렉사를 기업 업무 시스템과 연결해 직원들의 업무 효율성을 높여 주는 ‘비즈니스용 알렉사’로, 알렉사를 통해 회의실 관리나 재고 관리 등이 가능함을 보여주었음, 또 하나는 ‘알렉사 프라이즈’로 사람처럼 대화하는 AI의 개발을 위해 아마존이 주최한 콘테스트였는데, 수상작들은 아직 미흡하나 사람과 흥미로운 대화가 가능할 수 있음을 보여주었음
[ 본 문 ]
11월말 열린
‘아마존웹서비스 리인벤트(AWS
re:Invent) 2017’에서는 두 가지 이벤트가 눈길을 끌었는데, 우선 아마존은 ‘비즈니스용 알렉사(Alexa for Business)’를 발표하였음
Ø비즈니스용 알렉사는 음성 인식 기능을 이용해 업무 자동화를 한 것으로, 음성을
통해 명령을 내리고 필요한 정보를 전달받음으로써 업무 처리의 시간 효율성을 높이는 것이 목적임
<자료> Amazon
[그림 1] 비즈니스용
알렉사 스타터 키트
Ø소비자용 음성 비서였던 알렉사를 기업용으로 전환한 서비스로, 규칙이
정해진 업무나 단순한 업무를 중심으로 가상 비서가 처리를 대신함으로써 업무 환경을 보다 직원 친화적으로 조성하여 핵심 업무에 집중할 수 있도록
한다는 것
Ø가령 알렉사가 탑재된 인공지능 스피커 아마존 에코(Echo)를 회의실에
두면 방 예약 및 화상 회의 연결을 말로 지시 할 수 있으며, 문서 출력실에 둔다면 용지가 떨어졌을
때 에코에게 주문을 지시할 수 있어 사무 업무가 편리해 질 수 있음
Ø아마존은 비즈니스용 알렉사 스타터 키트로 우선 ‘에코, 에코닷, 에코 쇼’의 3가지 디바이스를 선보였는데, 이 중 ‘에코 쇼(Echo Show)’는 기업용 서비스에서 처음 선보이는
디바이스 모델임
Ø비즈니스용 알렉사는 개인 이용 모델(Enrolled User)와 공유
모델(Shared Device)이 있는데, 전자는 모든 직원이
책상에 두고 개인 업무에 이용하는 형태이며, 후자는 회의실 등 공공 장소에 두고 여러 직원이 공동으로
사용하는 형태임
Ø현재 소비자용 알렉사가 무료인 반면, 기업용 알렉사 이용은 유료 서비스인데, 요금은 공유 모델이 디바이스마다 월7달러이고, 개인 이용 모델은 유저 당 월 3달러이며, 기업의 IT 부서에서 디바이스와 이용자 관리를 하게 됨
Ø비즈니스용 알렉사는 우선 영어, 독일어, 일본어 등 3개국 언어를 지원하지만, 언어별 음성인식 기술의 진전 정도에 따라 이용 국가는 점차 늘어나게 될 것임
아마존이 제시한 비즈니스용 알렉사의 대표적 활용 예는 회의실 관리인데, 시스코, 폴리컴 등 기업 커뮤니케이션 솔루션 업체들과 연계해 알렉사에 회의실 관리 기능을 추가하였음
Ø우선 각 직원들은 알렉사를 탑재한 기기를 책상에 두고 일정관리 비서로 활용할 수 있는데, 알렉사에게 회의 일정을 질문해 확인할 수도 있고, 다른 팀과 미팅
일정을 잡아달라고 요청하면, 이 요청을 다른 팀의 비서에게 전달한 후 협의하여 일정을 잡아 줌
Ø회의실에서도 알렉사를 비서로 활용할 수 있는데, 화상회의를 시작해
달라고 요청하면 알렉사가 지정된 번호로 전화를 걸게 되고 모니터에 회의 참가자의 얼굴이 비춰지게 됨
<자료> Amazon
[동영상] 비즈니스용
알렉사의 다양한 활용: 회의 진행 보조와 안내 데스크 역할 등
Ø프리젠테이션 중에 자료가 필요하다면 알렉사에게 원하는 자료를 보여 달라고 지시할 수 있고, 알렉사는 지난달 매출 실적 등과 같이 업무 시스템에 요청하여 받은 자료가 화면에 보여지도록 처리하게 됨
Ø회의실 외에도 다양한 장소에 설치하여 활용 방안을 만들어 나갈 수 있는데, 가령
사무실 입구에 알렉사 탑재 기기를 설치해 두면 알렉사가 안내 데스크의 역할을 할 수 있어, 만나고 싶은
직원의 방 위치를 묻는 질문에 답해줄 수 있음
Ø문서 처리실에 설치해 두면 용지 부족 시에 종이 주문을 명령하는 것 외에도, 컬러
출력 작업을 긴급히 해야 하는데 해당 컬러 프린터에서 흑백 인쇄 작업이 진행 중일 경우, 해당 작업을
흑백 프린터로 옮겨 인쇄할 것을 명령하는 등의 일도 할 수 있음
알렉사의 비즈니스 솔루션은 아마존의 파트너 기업들이 제공하게 되는데, 세일즈포스닷컴, 폴리컴, 컨커 등 유명 기업용 솔루션 업체 외에도 많은 스타트업들이
파트너로 참여 중
Ø스타트업 ‘팀(Teem)’은 이미 많은 기업에서 회의실 관리에 사용하는 솔루션을 제공 중이며 회의실
입구에 디스플레이를 설치해 룸 이용 현황을 보여주는데, 알렉사와 연동해 음성을 통한 회의실 관리 기능을
제공할 수 있게 되었음
Ø회의실을 예약 할 때는 방에 설치되어 있는 에코 디바이스에 ‘알렉사, 팀(Teem)에 이 방 예약을 요청해 줘”라고
명령하고, 회의실 사용을 시작하면 “알렉사
팀에게 이 방 체크인을 요청해 줘”라고 말하며, 회의 시간 연장 요청 등도 명령할 수 있음
Ø ERP 솔루션을 제공하는 스타트업 ‘애큐매티카(Acumatica)’는 알렉사를 이용하여 재고 관리 시스템을
음성으로 제공하기 때문에, “알렉사, 애큐매티카에 노트북 재고가 얼마나 있는지 물어봐 줘”등과 같이 명령할 수 있으며, 답을 듣고 재고량이 부족하다고 판단하면 “알렉사, 애큐매티카에 10개를 주문해 달라고 해줘”라고 명령할 수 있음
Ø ERP와 같은 기간 시스템에 접속하기 위해서는 알렉사의 인증 기능을 강화하는 것이 과제가 되는데, 알렉사의 인증 방식은 4자리의
PIN(개인식별번호)을 말로 이야기하는 것이 일반적이나
PIN을 다른 사람이 들을 위험이 있어 성문 등 생체 인식 인증을 준비 중이라고 함
Ø고급 리조트 호텔인 ‘윈 라스베이거스(Wynn Las Vegas)’는 모든 객실에 아마존 에코를 도입하여 활용 중인데 총 4,748 개의 에코가 설치되어 있어 손님들은 호텔과 객실 정보를 프런트가 아닌 에코에 물어볼 수 있음
<자료> Wynn Las Vegas
[동영상] 호텔 전 객실에 배치된 아마존 에코
Ø또한 숙박 고객은 음성으로 객실 시설을 컨트롤 할 수 있는데, “알렉사 나 들어 왔어”라고 말하면 방의 전등이 켜지며, “알렉사 뉴스 틀어줘”라고 말하면 TV가 켜지고 뉴스 채널이 선택됨
Ø알렉사가 컨시어지 서비스가 되어 손님들을 지원하게 되는 것인데, 호텔
측은 숙박객이 프런트에 전화하는 횟수가 줄어 비용 절감 효과가 있는 것으로 분석하고 있음
미국에서는 AI 스피커가 소비자들에게 대체로 좋은 평을 얻어가고 있는
중이기 때문에, 명령 처리 구현이 상대적으로 용이한 기업용 알렉사 역시 반응이 좋을 것으로 예상됨
Ø아마존의 워너 보겔스 CTO는 음성을 통해 직원과 시스템이 자연스럽게
상호작용 하는 것이 AI가 기업의 비즈니스에 가져올 첫 번째 파괴적 혁신이라며, 대화형 컴퓨팅이 미래에 어울리는 자연스러운 사용자 환경이라고 비즈니스용 알렉사의 출시 의의를 설명하고 있음
Ø AI 기반 대화형 컴퓨팅은 기술적 측면으로만 보면 소비자용 서비스보다 처리 업무가 구조화되어 있는 기업용 서비스에서
보다 용이하게 구현할 수 있음
Ø소비자용 AI 음성인식 서비스에서는 일정관리 같이 정해진 태스크를
처리해야 하는 경우도 물론 있지만 이용자의 상황과 감정에 맞게 ‘대화’를 나누는 것 자체가 보다 중요한 경우가 있기 때문에 보다 고도의 지능적인(인간적인) AI 기술의 구현이 뒷받침되어야 함
Ø반면 기업용 음성인식 서비스는 직원의 태스크 처리 지원이 본질적인 기능이기 때문에, 즉 업무 처리를 손이 아닌 ‘말’로 한다는 ‘인터페이스’의 성격이 강하기 때문에 명령어를 정확하게 인식하는 것이 중요하며 사실 인공지능적
기능은 그리 필요하지 않음
Ø명령어만 올바로 인식이 된다면 그 다음은 기업의 업무 시스템에 그 명령어를 전달하기만 하면 되고, 업무 시스템들이 처리해 준 결과를 다시 이용자에게 전달해주면 되기 때문
Ø인공지능 스피커를 이용해 본 경험이 있는 직원들이라면 생소함 없이 비즈니스용 알렉사를 이용할 수 있을 것이며, 기업에서 알렉사는 정해진 태스크만 처리하면 되므로 보안 이슈 등으로 인해 인터페이스에 노이즈 발생이 없다면
도입 효과는 높을 것으로 전망해 볼 수 있음
AI 스피커와 관련한 아마존의 목표 ‘대화하는 AI의 개발’이기 때문에, 이번 리인벤트 2017에서 비즈니스용 알렉사보다 눈길을 끈 것은
아마존의 ‘알렉사 프라이즈’콘테스트임
Ø‘알렉사 프라이즈(Alexa Prize)’는 20분간 사람과 대화할 수 있는 채팅 로봇 개발을 목표로 아마존이 총상금
250만 달러를 내걸고 주최한 경진 대회로 올해가 첫 행사였는데, 올해 9월부터 2개월간 진행되었고 리인벤트 2017 컨퍼런스에서 시상식이 진행되었음
Ø 22개국에서 100개 이상의 대학 팀이 기술을 겨룬 이번 대회에서는 워싱턴 대학 팀이 우승을 차지해 50만 달러의 상금을 받았음
<자료> Amazon
[그림 2] 대화 AI 개발을 위한 알렉사 프라이즈
Ø AI에게 대화 기법은 매우 어려운
일이어서 영원히 목표에 도달할 수 없다는 의견도 있을 정도인데, 아마존은 알렉사를 통해 이 목표에 다다를
기술을 연구하고 있지만 대학 팀의 연구 참가로 젊은 두뇌들에 의한 돌파구를 기대하며 이번 콘테스트를 개최하였음
아마존은 대화하는 AI를 ‘소셜봇(Socialbot)이라 부르는데, 소셜봇은 채팅봇으로도 불리며, 알렉사의 스킬(Skill, 앱스토어의 앱에 해당) 중 하나로 분류됨
Ø소셜봇은 에코를 통해 다양한 화제에 관해 이용자와 음성으로 대화하는데, 연예, 스포츠, 정치, 패션, 기술 등을 대화 화제로 자연스럽게 대화가 진행되도록 하는 것이 개발 목표임
Ø참가 팀은 아마존에서 제공하는 음성 응용프로그램 개발 환경(Alexa
Skills Kit)을 사용하여 소셜봇을 개발하게 되며, 심사위원이 소셜봇과 20분간 대화한 후 회화 능력을 평가하게 됨.
Ø구체적으로 소셜봇이 화제의 일관성을 가지고
있는지(Coherently), 상대를 끌어 당기는지(Engaging)
등의 능력을 평가하는데, 이는 튜링 테스트(AI가
인간인 척하는 능력의 시험)가 아니고, 어디까지나 회화 능력을
시험하는 것임
Ø상위 3개 팀의 소셜봇은 공개되어 있으며 아마존 에코에 설치하여 직접
대화해 볼 수 있는데, 실제로 소셜봇과 이야기해 본 사람들은 대체로 기술력이 아직 미완성이어서 대화가
어눌하고 서툴다는 평을 내놓고 있음
Ø그러나 소셜봇이 꺼내 놓는 주제가 재미있고 입담도 느껴져 대화에 매료되었다는 평도 있으며, 인간 수준에 도달하려면 아직 시간이 걸리겠지만 큰 잠재력이 있음을 실감했다는 의견도 많음
[동영상] 스포츠를 주제로 한 소셜봇과 대화 장면
우승을 차지한 워싱턴 대학 팀의 채팅봇을 비롯해 소셜봇은 이용자의 질문에 반응하는 것뿐만 아니라 AI가 습득한 지식을 기반으로 대화를 주도해 나갈 수 있는 것이 특징임
Ø아마존 에코에서 소셜봇을 시작하면 소셜봇은 우선 ‘기분은 어떻습니까’와
같이 가벼운 인사를 한 후 대화에 들어가는데, 대화 기법에서는 이를 ‘아이스브레이커(Icebreaker)’라 부르며 갑자기 본격적인 대화에 들어가는 것이 아니라 우선 딱딱한 분위기를
풀어 주기 위한 것임
Ø분위기가 풀어졌다고 생각하면 소셜봇은 상대가 흥미를 가질 만한 대화의 주제를 제시하는데 이는 대화 기법 중 ‘토픽 제안(Topic Suggestion)’에 해당하는 것으로, 소셜봇은 처음
대화를 갖는 상대에게는 일반적으로 받아들여질 수 있는 화제를 제시함
Ø소셜봇이 제시한 몇 가지 주제 중에서 가령 ‘인공지능’에 관해 이야기하자고 대답하면 소셜봇은 ‘페이스북이 이용자가 올린 사진에서 그 사람의 감정을 추측하는 AI를 개발하고 있다’는 등 인공지능과 관련한 몇 가지 재미있는
이야기들을 말해 줌
Ø이는 대화 기법 중 ‘지식 섭취(Knowledge Ingestion)’에
해당하며, 소셜봇은 최신 화제거리를 항상 받아보기 때문에 대화에서 깊은 지식을 내비치며 상대를 끌어
당길 수 있는데, 이는 사람 사이의 대화에서 신선한 화제가 많은 사람이 상대에게 호감을 주는 것과 같은
것임
Ø소셜봇의 이야기에 대해 ‘어떻게 그런 구조가 가능하지?’라고 되묻거나 짓궂은 질문을 던지게
되면 소셜봇은 아직 제대로 답을 하지 못하는 경우가 많음
Ø상대가 관심을 가지고 있는 사안에 대해 심도 있게 설명하는 것을 대화 기법에서는 ‘심해 잠수(Deep Dive)’라고 부르는데, 딥 다이브가 잘
되어야 이야기가 깊어지고 대화가 진행되는데, 현 단계의 소셜봇은 딥 다이브 단계의 대화가 잘 이루어지지
않고 있음
Ø소셜봇은 비록 대답을 못하더라도 거기서 그치지 않고 ‘인공지능과 관련한 이야기를 계속할까요?’등의 질문을 하는데, 이는 대화 기법 중 ‘대화 주도(Leading Conversation)’라
하는 것으로 대화가 중단될 것 같은 경우에 대화를 이끎으로써 계속 이어지게 하는 것임
Ø소셜봇은 종종 사용자가 원하는 주제를 무시하고 자신이 준비한 이야기를 하는 모습을 보이는데 비록 상대가 소셜봇이라는
것을 알지만 기분이 좋게 느껴지지 않는다는 평을 듣고 있으며, 반대로 사람이 주제를 갑자기 바꾸면 어떻게
된 거냐며 불안한 정서를 내비친다고 함
Ø소셜봇 이용자들은 대체로 아직 소셜봇과 인간처럼 대화하는 것은 어렵지만 대화의 내용은 재미있고 대화 시간은 10~15분 정도인 것으로 평가하고 있는데, 아마존의 목표가 20분간 대화인 데에서 알 수 있는 아직 연구 개발은 더 지속되어야 할 것으로 보임
[동영상] 영화를 주제로 한 소셜봇과 대화 장면
소셜봇은 아마존의 음성 응용프로그램 개발 환경에서 만들어지므로, 연구
팀은 아마존이 제공하는 음성 인식과 음성 합성 기능을 이용할 수 있음
Ø음성 인식(Automatic Speech Recognition) 기능은 음성을 텍스트로 변환하는 과정에 이용하며, 음성 합성(Text-to-Speech) 기능은 텍스트를 음성으로
변환하는 과정에 이용하는데, 이를 통해 사람이 하는 말을 시스템이 인식하게 되고 소셜봇의 의도가 알렉사의
목소리로 나오게 됨
Ø연구 팀들은 음성 인식과 음성 합성의
중간 프로세스에 해당하는 대화 기술을 개발하고 그 기량을 견주게 되는데, 아마존은 원활하게 대화하는
것은 물론이거니와 소셜봇의 입담이나 캐릭터 등도 개발도 목표로 하고 있음
Ø연구자들은 소셜봇이
흥미로운 주제를 이야기하는 것뿐만 아니라 자신의 주장을 가지고 의견을 말할 수 있는 단계가 시야에 들어왔다고 말하고 있으며, 상대방의 말에 농담으로 답변할 수 있는 단계가 되면 완성도가 부쩍 향상될 것으로 보고 있음
자율운전 자동차 기술이 대학 간의 경쟁을 통해 급진전을 이루었듯, 아마존은
대학의 연구에서 ‘대화하는 AI의 개발’이라는 거대한 도전의 목표가 달성될
것을 기대하고 있음
Ø아마존 에코와 구글 홈의 보급이
폭발적으로 증가하고 있고, 비즈니스용 알렉사가 출시되어 이제 기업에서의 활동도 점차 늘어나게 된다면, 이미 대학에서 뜨거운 연구 주제로 부상한 AI에 대한 연구 열기는
더욱 높아질 것임
<자료> Greg Shank
[그림 3] 알렉사
프라이즈에 참가한 대학들
Ø자율운전차 기술도 대학 연구팀의 참여가 늘어나며 거대 IT 기업과
자동차 제조업체에 우수 인재들이 진출하게 되고, 새로운 자율운전 관련 하드웨어와 소프트웨어 스타트업들이
등장하며 단기간에 급진전을 이룬 바 있음
Ø아마존은 음성인식 인공지능 분야에서도 이 같은 연구 열기가 재현되기를 기대하며
2018년에도 알렉사 프라이즈 콘테스트를 준비하고 있음
Ø또한 대학의 연구 역량과 연계하려는 이런 시도는 비단 아마존뿐 아니라 AI 가상
비서 시장을 놓고 경쟁 중인 구글, MS, 애플 등을 통해서도 전개될 가능성이 높음
Ø대화하는 AI의 개발이 과연 가능할 것인지, 대화하는 AI가 과연 얼마나 인간에 가까워질 수 있을 것인지, 2018년에 또 하나의 인류의 위대한 도전(Grand Challenge)이
본격화될 것으로 보임
장난감 로봇 ‘코즈모(Cozmo)’는 주요 소비자인 어린이나 키덜트 뿐
아니라 AI(인공지능)와
IoT(사물인터넷)에 관심이 있는 엔지니어 및 과학자들의 주목을 받고 있음
Ø코즈모는 사용자와 친구가 되어 대화나 게임 등 커뮤니케이션을 통해 사용자를 즐겁게 해주는 소형 장난감 로봇으로
카네기 멜론 대학 출신의 로봇 연구원 한스 태피너가 창업한 스타트업 ‘안키(Anki)’에서 만들어 판매하고 있음
<자료> ITPro
[그림 1] 코즈모
개발자 한스 태피너
Ø코즈모는 내장 카메라로 촬영한 이미지를 통해 사용자의 얼굴을 인식하고 놀고 있는 상대가 누구인가를 기록하는데, 놀면 놀수록 사용자를 따르는 듯한 동작을 취함
Ø코즈모는 LCD 모니터로 된 얼굴을 가지고 있으며 여기에 감정을 나타내는
다양한 표정을 애니메이션으로 표시하는데, 애니메이션은 할리우드 영화 스튜디오에서 스카우트한 애니메이터가
제작한 것임
Ø코즈모는 부속으로 포함된 큐브를 이용한 게임을 매우 좋아하며 사용자에게 종종 게임 대결을 조르기도 하는데, 예를 들어 ‘빨리 누르기 게임’은 무작위로 색이 변하는 두 개의 큐브를 나란히 놓고 두 큐브의 색이 같을
때 큐브의 버튼을 누르는 게임임
<자료> Anki
[그림 2] 이용자와
큐브 게임을 하는 코즈모
Ø먼저 버튼을 누르는 쪽이 승자가 되는데, 코즈모는 큐브의 색을 주의
깊게 모니터링 하다가 색상이 일치하면 팔을 사용해 빠르게 버튼을 누르며 자신이 이기게 되면 노래를 부르며 춤을 춤으로써 기쁨의 감정을 표시함
Ø코즈모는 돌아 다니며 노는 것도 좋아하여 혼자 놔두면 테이블 위를 자율적으로 움직이는데, 테이블에서 떨어질 걱정은 하지 않아도 되는 것이 카메라와 적외선 센서, 자이로
센서 등을 사용하여 주변의 상황이나 자신의 자세를 파악할 수 있기 때문
Ø코즈모는 테이블 가장자리에 다다르면 벌벌 떠는 등 ‘무서움을 느끼는 듯한’몸짓을 하면서 테이블 안쪽으로 되돌아 감
코즈모를 개발한 한스 태피너는 코즈모는 흔히 보는 로봇 형의 장난감이 아니라,
장난감으로 가지고 놀 수 있는 로봇이며 제대로 된 인공지능(AI)을 탑재하고 있다고 말함
Ø코즈모는 손바닥만한 초소형의 몸체에 놀랄 만큼 풍부한 기능을 제공하는 소프트웨어를 구현하고 있는데, 소프트웨어 프로그래밍 코드가 180만 라인에 달한다고 함
Ø안키의 한스 태피너 CEO가 ‘제대로 된 AI’를 탑재했다고 자신 있게 말하는 근거는 두 가지인데, 첫번째는 카메라를 이용한 이미지 인식 기능으로, 코즈모는 오픈소스
소프트웨어(OSS) 이미지 인식 소프트웨어 라이브러리인 ‘OpenCV’를 사용하고 있음
Ø두번째 근거는 안키가 ‘이모션 엔진(emotion engine)’이라 부르는 것으로, 코즈모가 마치 감정을 가지고 있는 생물처럼 보이게 하는 행동 방식이 탑재되어 있다는 점
Ø코즈모는 표정과 팔의 움직임, 소리 등을 조합해 감정을 표현하는데
조합 패턴은 수천 가지가 넘지만 프로그래머가 설정한 경우의 수에 따라 표정이나 행동이 결정되는 것은 아니며, 코즈모가
자신의 ‘감정’에
따라 표정이나 행동을 결정한다고 함
Ø코즈모는 행복(Happiness), 자신감(Confident), 용기(Brave), 공격성(Charge), 흥분(Excitement), 사교(Social), 승부욕(Winning) 등 감정과 관련된 여러 변수를
가지고 있는데 사용자와 커뮤니케이션에 따라 이들이 변하게 된다는 것
Ø코즈모의 표정이나 행동은 변수의 변화에 따라 결정되므로 안키의 개발자들도 상상하지 못한 표정과 행동을 코즈모가
보이는 경우도 있다고 함
<자료: Linus Tech Tips>
코즈모가 소형 본체에 AI 기능을 탑재할 수 있는 것은 소위 ‘엣지 컴퓨팅(Edge Computing)’개념을 도입해 스마트폰의 처리
능력을 가져와 프로그램을 구동시키기 때문
Ø사실 코즈모에 탑재된 프로세서는 임베디드용 ‘ARM Cortex-M4’이기 때문에 이미지 인식과 같은 고급
소프트웨어를 실행시키는 것은 절대 불가능함
Ø코즈모의 소프트웨어는 본체가 아닌 코즈모와 블루투스로 연결된 스마트폰을 통해 작동되는데, 이것이 180 만 라인의 코드로 개발한 소프트웨어를 초소형 로봇에서
실행시킬 수 있는 비밀임
Ø코즈모를 이용하려면 스마트폰이나 태블릿에 전용 앱을 설치하고 블루투스를 통해 코즈모에 연결해야 하며, 사용자가 코즈모 앱을 통해 코즈모의 카메라가 찍은 사진을 보면서 원격으로 조종하는 것도 가능함
Ø이러한 코즈모의 작동 메커니즘은 IoT 분야에서 말하는 ‘엣지 컴퓨팅(edge computing)’인데, 컴퓨팅 파워가 약한 IoT 장치가 기계학습과 같은 무거운 프로그램은 가동할 수 있게 하는 기술임
Ø이전까지는 IoT 기기에서 고급 소프트웨어를 작동시키기 위해 프로그램을
모두 ‘클라우드’로
이동시키고 IoT 디바이스는 클라우드의 지시에 따르게 한다는 접근 방식이 주를 이루었음
Ø그러나 이 방식은 프로그램이 클라우드에서 작동해 내려오므로 ‘지연(latency, 레이턴시)’이 불가피하기 때문에 코즈모와 같이
사용자와 상호 작용하는 앱에는 적합하지 않은 단점이 있음
Ø코즈모 역시 기기 자체의 컴퓨팅 파워가 약하기 때문에 무거운 프로그램을 기기에서 실행할 수 없지만, 네트워크의 엣지(맨 끝)에
있는 스마트폰이나 태블릿에서 프로그램을 구동시키기 때문에 클라우드 보다 낮은 지연으로 프로세스를 실행할 수 있음
Ø초소형 로봇처럼 컴퓨팅 파워가 약한 IoT 디바이스에서 AI와 같이 고도의 기능을 실현하려는 기업들에게 코즈모의 접근 방식은 좋은 참고가 될 수 있음
<자료> Anki
[그림 3] 코즈모
코드 랩의 프로그래밍 플랫폼
Ø이것이 안키에 대해 어린이뿐 아니라 연구자들이 관심을 갖는 이유인데, 안키가
코즈모 프로그램의 커스터마이징을 할 수 있도록 제공하는 SDK(소프트웨어 개발 킷)은 현재 카네기 멜론 대학과 조지아 공과 대학 등의 연구자들도 이용하고 있음
Ø안키가 운영하는 ‘코즈모 코드 랩’은 스크래치 블록 기반의 프로그래밍 플랫폼을 제공하고 있으며, 이용자들은 이를 통해 드래그 앤 드롭으로 원하는 기능을 추가할 수 있는데, 최근
코즈모 코드 랩은 대규모 업데이트를 통해 기능을 확장하였음
웨이모(Waymo)가 테스트 중인 완전 무인 택시는 자율주행 기술 6단계 중 5단계 진입을 뜻하는데, 이는 차량 안전성에 대한 책임이 사람에서 자동차 제조업체로 옮겨진다는 점에서 큰 의의가 있음. 안전성 책임을 떠안겠다고 선언한 셈이므로 웨이모는 안전성 확보를 위해 소프트웨어 개발, 하드웨어 사전 정비, 서비스 UI 개발 등 여러 측면에서 노력하고 있는데, 특히 자율주행 차량의 최적 경로 결정을 인공지능이 아닌 사람에 맡김으로써 책임 소재 규명이 가능한 구조를 선택하고 있음
[ 본 문 ]
알파벳 산하 ‘웨이모(Waymo)’의 무인 택시 시범 서비스는 자동차 사고의 책임이 사람에서 자동차 제조업체로 넘어오는 단계에 진입하고 있음을 보여 줌
Ø웨이모는 지난 11월부터는 보조 운전자가 탑승하지 않는 무인 택시
운행서비스를 전개하고 있는데, 현재 수십 개 기업이 자율주행 차량 기술을 테스트하고 있지만 위급 상황에
관여할 운전자가 탑승하지 않는 완전 자율주행 차량의 도로 주행 테스트는 웨이모가 처음임
Ø미국자동차기술학회(SAE)는 자율주행 기술의 발전 단계를 6단계로 구분(레벨0~레벨5)하고 있는데, 전문가들은 웨이모가
5단계인 레벨4에 해당하는 것으로 보고 있음
Ø자율운전 기술 진화의 최종 단계인 레벨5는 운전자가 어떤 주행 상황에도
전혀 개입하지 않는다고 규정하고 있으므로 사고시 책임 소재가 명확히 ‘자동차 제조업체’에 있음
Ø그러나 다섯 번째 단계인 레벨4는 운전자가 ‘요건이 갖춰진 경우’에 한해 운전에 전혀 개입하지 않는다고 규정하고 있어 사고 발생시 법적 책임 소재에
약간의 모호성이 발생할 수 있음
Ø레벨4의 규정은 요건이 갖춰진 경우 주행과 관련된 모든 결정은 시스템이
하며 따라서 결과의 책임이 ‘자동차’에 있음을 의미하지만, 아직 자율주행차
관련 법규가 구체적으로 제정되지 않아 ‘정해진 조건’이 무엇이 되느냐에 따라 소비자와 제조업체간 분쟁이 발생할 소지가 있음
Ø전문가들은 뭬이모가 무인 택시로 운행되는 데서 보듯, 레벨4부터 탑승자는 승객에 불과하기 때문에 원칙적으로 제조업체의 안전운행 책임을 명문화할 필요가 있다고 보고 있음
[표 1] 미국 자동차기술학회(SAE)의
자율주행 기술발전 단계 구분
Level 0
(비자동화)
- 운전자가 차의 속도와 방향을 계속 통제한다
- 시스템은 주행에 전혀 영향을 주지 않는다
Level 1
(운전자 보조)
- 운전자는 차의 속도 또는 방향을 계속 통제한다
- 시스템은 주행과 관련한 다른 기능에 개입한다
Level 2
(부분 자동화)
- 운전자는 반드시 능동적으로 주행에 개입하고 주변 상황을 항상 주시한다
- 시스템은 정해진 조건에서 차의 속도와 방향을 조절한다
Level 3
(조건부 자동화)
- 운전자는 능동적으로 주행에 개입하거나 주변 상황을 항상 주시하지 않아도 되지만, 항상 직접 주행을 통제할 준비가 되어 있어야 한다
-시스템은 정해진 조건에 차의 속도와 방향을 조절하고, 기능
구현이 한계에 이르기 전에 운전자가 능동적 운전을 이어나가도록 알림으로써, 운전자가 대응할 수 있는
시간적 여유를 주어야 한다
Level 4
(고도 자동화)
- 운전자는 정해진 조건에서 운전에 전혀 개입하지 않는다
- 시스템은 정해진 조건의 모든 상황에서 차의 속도와 방향을 통제하고 능동적으로 주행을 한다
Level 5
(완전 자동화)
- 운전자는 모든 상황에 개입하지 않는다
- 시스템은 주행 중 모든 경우에 차의 속도와 방향을 통제하고 능동적 주행을 한다
<자료> Society of Automotive Engineers
자율운전 차량 사고의 책임이 제조업체 쪽으로 옮겨간다면 소비자 입장에서 가장 궁금한 것은 웨이모의 안정성인데, 안정성은 결정하는 것은 우선 소프트웨어의 완성도임
Ø웨이모의 소프트웨어는 가상 및 실제 환경으로 나누어 테스트되는데, 개발된
자율운전 소프트웨어는 우선 시뮬레이터를 통해 알고리즘을 교육하고 학습한 기능을 검증하게 됨
<자료> Waymo
[그림 1] 시뮬레이터에서
자동차 구동 모습
Ø웨이모는 고급 시뮬레이션 환경에서 알고리즘 교육을 실시하는데, 시뮬레이터를
통해 25,000 대의 웨이모를 구동시킴으로써 매일 800만
마일의 주행 테스트를 하는 효과를 얻고 있음
Ø시뮬레이터를 사용하면 시험 주행 거리를 늘릴 수 있을 뿐만 아니라, 실제
현실에서는 별로 발생하지 않는 이벤트도 생성해 교육시킬 수 있는데, 예를 들어 교차로에서 좌회전 신호가
깜빡이는 등 자주 발생하지 않지만 사고 연관성은 높은 신호 상황을 만들어 낼 수 있음
Ø시뮬레이터는 실제 거리를 소프트웨어로 재현하고 있는데, 가상으로 구현된
거리는 실제 시가지를 스캔한 데이터를 바탕으로 구축된 것으로, 전용 차량에 탑재된 라이다(Lidar, 레이저 센서)를 통해 거리를 스캔한 후 정밀 3D 지도를 제작한 것임
Ø지도에는 차선, 인도, 신호등
등이 표시되는데 여기에는 차선의 폭과 인도의 높이 등 주행 정보 가 포함되어 있으며, 그 위에 좌회전
신호가 깜박이는 교차로 등 특수 이벤트 발생 상황을 구현할 수 있음
시뮬레이터에서는 조건을 다양하게 바꾸거나 환경에 변화를 추가한 후 테스트를 실행하는 ‘퍼징(Fuzzing)’과정을 통해 소프트웨어의 완성도를
높여 가게 됨
Ø시뮬레이터에서 조건이 구성되고 나면 가상의 거리를 자동차로 주행하는데, 이를
통해 좌회전 신호가 깜박이는 교차로에서 회전하는 연습을 하게 됨
<자료> Waymo
[그림 2] 시뮬레이터에서
교차로 좌회전 상황 학습
Ø이 경우 자동차는 교차로에 천천히 진입하며 마주 오는 차량이 없는 것을 확인한 후 좌회전하게 되는데, 알고리즘이 개선되어 갈 때마다 동일한 조건에서 주행 시험을 반복함으로써 습득한 운전 기술의 완성도를 높여 나감
Ø시뮬레이터의 환경에는 변화를 추가할 수 있는데, 이를 퍼징(Fuzzing)이라 하며, 가령 좌회전 신호 시에 마주 오는 차량의
속도를 바꾸거나 신호등 타이밍을 바꿀 수 있고, 새로운 조건에서도 자동차가 안전하게 좌회전 할 수 있는지
확인해 볼 수 있음
Ø또한 실제로는 거의 있을 수 없는 상황 조건을 구현할 수도 있는데, 오토바이가
백색 차선 위를 따라 달리거나 사람이 차선 사이를 지그재그로 달리는 상황 등을 생성한 후 비정상적인 행동이 발생할 때 자동차가 어떻게 반응하는지
확인해 볼 수 있음
Ø이처럼 웨이모 자율운전 자동차는 주요 기술을 시뮬레이터에서 배우고 연습을 거듭해 완성도를 높이고 있으며, 2016년 한 해에만 시뮬레이터에서 25억 마일을 주행했다고 하는데, 이는 지구를 10만 바퀴 돈 거리에 해당함
시뮬레이션을 통과한 소프트웨어는 자동차에 탑재되어 도로 주행 테스트를 하게 되는데, 전용 서킷에서 테스트를 거친 후 실제 도로에서 시험 주행을 하게 됨
Ø소프트웨어를 탑재한 시험 차량은 전용 서킷인 ‘캐슬(Castle)’에서 주행 테스트를 하는데, 캐슬은 구글이 공군 기지 철거 부지를 사들인 후 실제 거리 풍경을 그대로 재현한 곳임
<자료> Google Earth
[그림 3] 자율주행차
테스트용 전용 서킷 ‘캐슬’
Ø캐슬에서 새로 개발된 소프트웨어와 수정된 소프트웨어가 검증되며 또한 드물게 발생하는 이벤트들도 시험하는데, ‘구조화된 테스트(Structured Tests)’라 불리는 이 과정에서 약 2만 가지의 시나리오를 검증하며, 검증이 끝난 소프트웨어는 도로에서
실제 테스트를 진행함
Ø웨이모는 지난 8년 동안 미국 전역의 20개 도시에서 350만 마일의 도로를 실제 주행했는데, 애리조나에서는 사막 환경, 워싱턴에서는 비 내리는 환경, 미시간에서는 눈 내리는 환경에서 테스트 하는 등 서로 다른 기상 조건에서 안전하게 주행 할 수 있는지 확인하고
있음
Ø도로 주행 테스트는 또한 홍보 활동을 겸하고 있는데, 지역 주민들이
자율운전 차량을 실제 접하게 함으로써 막연한 불안감을 없애고 이해하게 만드는 것을 목표로 하고 있음
Ø시뮬레이션 통과 후 실제 차량에 탑재 되어 전용 서킷과 실제 시가지 주행을 통해 기능과 안정성이 검증되면, 비로소 자율운전 소프트웨어는 최종 제품으로 출하가 됨
이처럼 웨이모가 여러 단계에 걸쳐 다양한 소프트웨어 테스트 및 실제 주행 테스트를 거쳐야 하는 것은 자율주행차의
최적 경로를 인공지능(AI)이 아닌 사람이 결정하기 때문임
[그림 4]웨이모의
최적 경로 결정 과정
Ø웨이모의 소프트웨어는 주변 객체의 움직임을 예상하고 그 바탕 위에 최적의 경로를 산출하는데 이를 ‘플래닝(Planning)’프로세스라 부르며, 플래닝을 통해 진행 방향, 속도,
주행할 차선, 핸들 조작 등을 결정하게 됨
Ø여기서 핵심 포인트는 플래닝 프로세스에 AI를 적용하지 않는다는 것인데, 플래닝의 로직은 코딩되어 있으며 자동차의 움직임은 사람이 프로그램으로 지정하고 있음
Ø즉 웨이모는 인간이 자율운전의 알고리즘을 파악할 수 있는 구조로 되어 있는 것인데, 이는 사고가 났을 경우 알고리즘 파악을 통해 책임 소재를 규명할 수 있는 장점이 있으나, 방대한 규칙이 정의되어야 하며 그 개념들을 검증하기 위한 대규모의 주행 테스트가 필요하게 됨
Ø웨이모의 이런 접근 방식은 플래닝 프로세스를 AI가 담당하게 하는
엔비디아와 대비되는 것인데, 엔비디아는 AI가 인간의 운전을
보고 운전 기술을 배우는 ‘AI
Car’개발을
목표로 하고 있음
Ø AI Car는 추상적인 도로 개념을 이해해 차선이 없어도 인간처럼 운전하는 것을 목표로 하는데, 방대한 규칙의 정의가 필요하지 않고 알고리즘은 웨이모에 비해 간단해 질 수 있지만, AI의 의사결정 메커니즘은 인간이 전혀 이해할 수 없어 신뢰성의 문제가 발생하게 됨
Ø알파고의 경우 인간이 알파고의 메커니즘을 전혀 이해할 수 없더라도 결과적으로 사람을 이기기 때문에 그 수를 보고
연구하려는 마음이 생길 수 있지만, AI Car의 경우 사고가 났을 때 AI의 판단이 사람보다 나을 테니 무조건 사람이 운전한 쪽이 잘못이라 판정할 수는 없기 때문
한편 자율주행차는 무인으로 주행하기 때문에 소프트웨어 성능뿐 아니라 차량의 유지보수도 매우 중요하므로, 웨이모는 자동차 정비 전문 네트워크와 제휴를 맺고 있음
<자료> Waymo
[그림 5] 차고에서
정비 중인 웨이모 무인 택시
Ø웨이모는 지난 11월 무인 택시 서비스 시작에 즈음해 차량 유지보수
네트워크인 ‘오토네이션(AutoNation)’과 제휴를 발표하였으며, 애리조나와 캘리포니아에서는 이미 오토네이션을 통해 웨이모의 유지 보수 서비스를 실시하고 있음
Ø오토네이션은 미국 최대 자동차 판매기업으로 16개 주에 361개 매장을 보유하고 있으며 35개 제조업체의 자동차를 판매하고 있는데, 판매뿐 아니라 자동차
정비 사업도 전개하고 있음
Ø웨이모는 무인 자율운전 차량이기
때문에 문제가 발생할 경우 비상등을 켜고 수리할 수 없으므로, 오류가 발생하기 전에 부품 교환을 실시하는
등 예방 정비활동 중심으로 차량 유지보수를 해야 함
Ø비단 하드웨어에 대한 정비뿐 아니라
자율운전 차량은 고급 센서와 소프트웨어를 탑재하고 있기 때문에 이에 상응하는 소프트웨어 관리 기술도 요구됨
Ø자율운전 차량의 기기는 고가이기
때문에 제조원가를 조기에 상각하려면 24시간 연속으로 운행하게 될 가능성이 높은데, 이런 사업모델을 지원하기 위해서라도 자율운전 자동차의 유지 보수 기술은 매우 중요함
현재 자율운전 자동차의 안전에 관한 지표는 확립되어 있지 않기 때문에, 웨이모는
안전성 확보를 위해 여러 가지 관점에서 다양하게 접근하고 있음
Ø자율운전 차량의 도로주행 테스트를 어느 조건에서 얼마만큼 해야 하는 지에 대해서는 논란이 계속되고 있으며, 아직 업계 공동의 혹은 공공기관이 정한 안정성 기준은 마련되어 있지 않음
Ø그러나 캘리포니아 주의 경우 자율운전 차량의 도로 테스트 내용을 공표하도록 의무화 하고 있기 때문에, 그 중 ‘자율운전 기능 해제(Disengagement)’섹션을
통해 간접적으로나마 안전성을 추정해 볼 수는 있음
<자료> Department of Motor
Vehicles
[그림 6] 웨이모의
자율운전 기능 해제 횟수
Ø자율운전 기능 해제 조치(Disengagement)가 실행되었다는
것은 자동차가 위험한 상태에 놓이게 되었다는 뜻이므로, 이를 사고 상황 혹은 자율주행차가 설계대로 작동하지
않은 결함 발생 상황으로 해석해 볼 수 있기 때문
Ø웨이모의 자율운전 기능 해제 횟수는 2015년에 1천 마일 당 0.8회였으나
2016년에는 0.2회로 감소했으며, 2017년도
보고서는 아직 공개되지 않았지만 이런 추세가 이어졌다면 거의 발생하지 않았을 것으로 보임
Ø웨이모는 안전과 관련하여 여러 관점에서 장치를 마련하고 있는데, 철저한
주행 시험을 반복하여 자율운전 모드에서 350만 마일을 주행시켰으며,
차량의 주요 시스템인 스티어링이나 브레이크 등을 이중화 하여 하드웨어의 고장에 대비하고 있음
Ø운용 측면에서는 주행할 수 있는 영역을 ‘운행
설계 영역(ODD, Operational Design Domain)’로 정의해 자동차가 달릴 조건을 명확하게 파악하고 있으며, 탑승객과 인터페이스에도 신경을 써 무인 택시 승객이 사고 발생시에도 불안해 하지 않도록 기능 설계를 하였음
Ø개발 과정과 시험 결과만 놓고 보면, 그리고 안전하게 주행 할 수
있는 환경에서만 서비스를 제공하며, 무인으로 주행하더라도 운행 제어센터에서 원격으로 모니터하고 비상
사태에 대응하고 있다는 점을 고려하면 웨이모 무인 택시는 안전하다고 평가할 수 있음
안정성 확보를 위한 웨이모의 다양한 시도들은 기술을 현실에 맞추려는 기술업체들의 노력을 통해 자율주행차가 상용
서비스 단계에 본격 진입하고 있음을 보여주고 있음
Ø그 동안 자율주행차의 상용화 시기 전망이 어려웠던 이유는 ‘안전성’에 대한 확신을 과연 어떻게 할 수
있을지에 대한 사회적 합의가 이루어지지 않았기 때문임
Ø‘안전성’이슈는 단순히 사고 빈도를 얼마나
낮출 수 있느냐에 대한 것이 아니라, 긴급 상황 발생 시 대처 방안과 사고 발생 시 책임 소재 규명
및 그에 따른 보험 처리 방안까지 포함하는 사회관습적인 문제이자 법적인 문제임
Ø웨이모는 혁신적인 자율운전 기술에 맞춘 새로운 자동차 법규나 사회적 합의를 마련해 달라고 요구하는 데 머무르지
않고, 안전성에 관한 현재의 사회적 기준에 최대한 부합하기 위한 기술 개발 방식 및 서비스 운용 방식을
채택하여 그 완성도를 높여 나가고 있음
Ø특히 최적 경로 선택을 AI에 맡기지 않고 사람이 결정하는 방식을
택함으로써 오히려 더 지난한 테스트 기간을 자처하고, 완전 무인 자율주행 방식을 선택해 안정성과 직결된
책임의 문제를 업체가 부담하겠다고 나선 점은 결과를 떠나 높이 평가 받을 만한 지점임
Ø자동차 해킹 등 보안 이슈도 남아 있고 안전성에 대한 문제 제기는 끝이 없을 테지만, 웨이모가 보여준 전향적인 시도들로 인해 자율주행차 상용화 시점은 한층 더 앞당겨질 전망