※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1797호(2017. 5. 24 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

양자 컴퓨터 개발 스타트업 ‘리게티’, 양자 알고리즘 개발 플랫폼 제공.pdf



[ 요 약 ]


양자 컴퓨터 개발은 대학의 기초 연구와 관계가 깊고 IT 대기업들도 대학과 공동 연구를 진행하고 있기 때문에, IBM, 구글마이크로소프트 등 IT 공룡들뿐 아니라 대학에서 출발한 스타트업들의 활약도 눈에 띔이 중 대표적 양자 스타트업인 리게티 컴퓨팅은 반도체 칩의 성능이 한계에 다다름에 따라 발생하는 수퍼 컴퓨터의 거대화와 막대한 전력 소비의 문제를 해결하기 위해 양자 컴퓨터를 개발 중이며양자 알고리즘 개발 플랫폼을 제공하면서 업계의 관심과 기대를 모으고 있음



[ 본 문 ]

ž 스타트업 리게티 컴퓨팅(Rigetti Computing)은 반도체 칩 성능의 한계 봉착에 따른 수퍼 컴퓨터의 거대화와 막대한 전력 소비 문제를 해결하기 위해 양자 컴퓨터를 개발 중


Ø IBM과 구글은 최근 수년 내 범용 양자 컴퓨터를 상용화한다는 계획을 나란히 발표하였는데, 현 시점에서 이런 발표가 나오고 있는 것은 기술 패러다임의 관점에서 보면 수퍼 컴퓨터 성능이 한계에 가까워지고 있는 사실과 밀접한 관련이 있음



Ø 컴퓨터의 성능은 결국 실리콘 칩의 성능인데, 반도체 칩 하나의 성능을 높이는 것이 점점 더 어려워짐에 따라 수퍼 컴퓨터의 연산 능력을 높이려면 보다 많은 프로세서들로 구현할 수밖에 없는 상황에 맞닥뜨리고 있음


Ø 이는 프로세서의 성능이 18개월마다 두 배 향상된다는 무어의 법칙(Moor 's Law)이 끝나가고 있음을 의미하는데, 그 이유는 반도체 칩 회로의 선 폭을 더 이상 가늘게 할 수 없기 때문


Ø 현재 세계에서 가장 빠른 컴퓨터로 평가받고 있는 중국의 수퍼 컴퓨터 Tianhe-2(티엔허-2)는 프로세서로 인텔 제온(Intel Xeon) 32,000개 탑재하고 있으며 시스템 전체로는 312만 개의 코어가 사용되어 소비 전력은 24MW로 웬만한 한 개 도시에 공급되는 수준의 전력 소비를 필요로 함


<자료> CNTV

[그림 1] 중국의 수퍼 컴퓨터 티엔허 2


Ø 즉 현재의 수퍼 컴퓨터는 거대화라는 문제 외에도, 보다 치명적인 대규모의 전력 소모라는 문제점을 안고 있는데, 수퍼 컴퓨터 한 대 운영에 원자력 발전소 한 개가 필요한 꼴임


Ø 이 문제를 해결하고자 미국의 스타트업 리게티 컴퓨팅(Rigetti Computing)은 양자 컴퓨터 기술을 개발하고 있는데, 리게티는 구글 및 IBM과 마찬가지로 양자 컴퓨터를 클라우드로 제공할 계획이며, 주로 양자 화학 및 인공지능 분야의 응용프로그램에서 사용될 것을 겨냥하고 있음


ž 리게티는 양자 컴퓨터 개발의 의의에 대해, 고전 물리학의 세계에서 양자 역학의 세계로 거대한 도약을 하는 것이라 설명하고 있음


Ø 창업자인 채드 리게티(Chad Rigetti)는 양자 컴퓨터 개발의 의의를 물리학의 관점에서 설명하고 있는데, 컴퓨터의 역사를 되돌아 보면 동작 원리는 고전 물리학인 뉴턴 역학(Newtonian Mechanics)에서 양자 역학(Quantum Mechanics)으로 옮겨가고 있는 중이라고 함


Ø 컴퓨터 비즈니스 초기에는 많은 기업이 뉴턴 역학을 응용한 시스템을 기반으로 사업을 시작했는데, 성공을 거둔 대표적인 기업이 IBM


Ø 창업 당시 IBM의 회사명은 Computer Tabulating and Recording Company로 펀치 카드를 이용하는 관리 시스템을 만들던 회사였는데, 펀치 카드는 직원의 출퇴근 기록 등에 사용되었으며 카드에 구멍을 뚫어 구멍의 정렬에 정보를 인코딩 하는 기계적인 방식을 사용하였음


Ø 그 후 윌리엄 쇼클리(William Shockley)가 반도체를 발명하고 인텔이 이를 IC(집적회로)로 집적해 반도체 칩으로 출시했는데, 컴퓨터에서는 혁명적 기술이었지만 물리학의 관점에서 보면 고전 역학의 영역을 벗어나지 않는 것으로 그 작동 원리는 맥스웰 방정식으로 대표됨


Ø 맥스웰의 방정식(Maxwell 's Equations)은 전자기장의 작동을 정의하는 방정식인데, 고전 물리학 기반의 전자기학을 집대성한 것으로 평가받고 있음


Ø 반면 아인슈타인 등이 양자 역학의 기초 이론을 제창한 지 100 년 후에 등장한 양자 컴퓨터의 작동 방식은 슈뢰딩거 방정식(Schrödinger Equation)으로 정의되는데, 이는 양자 상태를 정의하는 방정식으로서 양자 역학 시대의 서막을 올린 발견으로 평가받고 있음


Ø 원자와 전자 등 미시적 수준의 작동 방식을 규명하는 양자 역학을 정보의 조작에 응용하는 양자 컴퓨터 개발은 연산 소자의 진화일 뿐만 아니라, 물리학의 관점에서 본다면 뉴턴 역학에서 양자 역학으로 거대한 도약이라 할 수 있음



<자료> Rigetti Computing


[그림 2] 리게티 컴퓨팅이 운영 중인 2대의 양자 컴퓨터


ž 리게티는 최근 벤처캐피털들로부터 막대한 개발자금을 투자 받아 연구를 진행 중이며, 현재 내부적으로 2개의 양자 컴퓨터를 작동 시키고 있음


Ø 양자 컴퓨터 개발의 대학의 기초 연구와 관련이 깊기 때문에 IT 대기업들과 대학의 공동 연구 및 인력 교류가 활발한데 설립자인 채드 리게티 역시 예일 대학에서 수년 동안 양자 컴퓨터 연구에 종사한 후 IBM의 양자 컴퓨터 개발에 참여한 바 있으며, 이후 2013년에 리게티를 설립


Ø 리게티는 유명 액셀러레이터인 Y-콤비네이터(Y-Combinator) 등으로부터 시드 펀딩을 받아 사업을 시작했으며, 올해 3월에 유명 벤처 캐피털인 안드리센 호로비츠(Andreessen Horowitz) 등에서 총 6,400만 달러의 투자를 유치해 기술 상용화를 위한 연구개발을 가속화 하고 있음



Ø 리게티는 예일 대학에서 단일 원자와 이온에 정보를 인코딩 하는 연구에 종사했으며, 극저온에서 전기 회로에 인공적으로 원자를 생성하는 방식을 연구했는데, 이 기술 방식을 통해 기존의 반도체 칩 제조 시설을 이용해 양자 칩을 양산화하는 기간을 단축할 수 있다고 함


Ø 리게티에서는 양자 기술을 IC(집적회로)화 하는 기법인 양자 IC(Quantum Integrated Circuit)를 개발하고 있는데, 현재 리게티가 개발한 양자 IC 칩에는 3개의 큐비트(Qubit)를 탑재할 수 있음



<자료> Rigetti Computing

[그림 3] 리게티가 개발한 양자 IC(집적 회로)


Ø 리게티 컴퓨팅의 자체 연구소에는 이미 두 개의 양자 컴퓨터가 작동하고 있는데, 그림 2에서 Rigetti BF01 Rigetti BF02라는 표지판 위쪽에 있는 흰색의 원통이 양자 컴퓨터의 케이스임


Ø 이 케이스 안에 양자 IC 칩이 포함되어 있으며 절대 영도 근처까지 냉각된 상태에서 가동되는데, 이 칩에 60~70 개의 큐비트를 탑재하게 되면 수퍼 컴퓨터 성능을 웃돈다고 함


ž 리게티는 양자 알고리즘 개발 인프라인 포레스트(Forest)를 공개했는데, 이는 양자 컴퓨터와 기존 컴퓨터를 연결하는 하이브리드 알고리즘을 개발할 수 있는 독특한 아키텍처임


<자료> Rigetti Computing


[그림 4] 리게티의 포레스트 플랫폼


Ø 포레스트 플랫폼의 개발 언어는 (Quil)이라 불리는데 이를 통해 양자 알고리즘을 작성하며, 개발된 알고리즘을 집약한 라이브러리인 그로브(Grove)와 개발 도구인 파이퀼(pyQuil)도 함께 제공되고 있음


Ø (Quil) 언어로 작성된 프로그램은 컴파일러를 통해 양자 프로세서용 객체를 생성하는데, 리게티의 양자 컴퓨터뿐만 아니라 타사가 개발하고 있는 범용 양자 컴퓨터 전반에 적용 할 수 있다고 함


Ø 퀼은 양자 알고리즘을 작성하는 프로그래밍 언어이지만, 동시에 양자 추상 머신(Quantum Abstract Machine, QAM)이라 불리는 양자 조작을 수학적으로 기술하는 구조이기도 함



Ø QAM은 양자 프로세서와 기존의 프로세서가 연계하여 가동하는 구조로 되어 있는데, 이러한 하이브리드 모델로 기존 컴퓨터의 메모리를 공유하여 양자 알고리즘을 실행하게 됨


Ø 그림 5의 왼쪽은 양자 컴퓨터에서 연산자를 지정하는 프로그래밍을 한 것으로, 큐비트 상태를 측정하면 이 정보는 기존 컴퓨터의 메모리(하단의 숫자 열)에 저장됨


Ø 그림 5의 오른쪽은 기존 컴퓨터 프로그램 로직으로 지정하고 실행한 것으로, 양자 컴퓨터 알고리즘 개발은 이해하기 어렵지만 하이브리드 모델은 기존의 프로그래밍 기술을 융합한 것으로 친숙한 것이 장점



<자료> Rigetti Computing


[그림 5] 리게티의 하이브리드 모델


ž 리게티 컴퓨팅은 양자 컴퓨터의 킬러 애플리케이션은 양자 화학(Quantum Chemistry)과 인공지능(AI)이 될 것이라 예상하고 있음


Ø 양자 화학은 현재 수퍼 컴퓨터를 이용해서도 연구를 진행하고 있지만, 양자 컴퓨터를 이용하면 대규모의 연산이 필요한 문제를 해결할 수 있는 장점이 있음


Ø 가령 고정밀도의 촉매를 생성하여 지구상의 이산화탄소를 흡수함으로써 지구 온난화 문제의 해결에 기여할 것으로 기대되고 있으며, 소재 연구에서 상온 초전도 소재를 찾아 내거나, 의료 분야에서 분자 구조를 기반으로 한 신약 개발을 가능케 할 것으로 기대되고 있음


Ø 또한 양자 컴퓨터는 인공지능(AI)과 기계학습에서 학습 모델을 시스템에 통합하여 기존 컴퓨터에서 구현할 수 없는 대규모 모델을 실행할 수 있을 것으로 예상되고 있음


Ø 한편 양자 컴퓨터가 기존의 암호체계를 붕괴시킬 가능성을 내포함에 따라 미국, 중국, 러시아 등 군사 강국들 간 양자 컴퓨터를 이용한 사이버 공격 역량 강화 경쟁이 시작되고 있는데, 채드 리게티는 양자 컴퓨터가 미국의 패권을 다시 강화하는 계기가 될 수 있을 것으로 전망


ž 스타트업 리게티의 등장은 양자 컴퓨터를 매개로 하여 현재의 IT 공룡들을 넘어설 새로운 기업의 탄생 가능성을 시사하며, 탄탄한 순수 과학 기반의 중요성을 환기시키고 있음


Ø 일반적으로 양자 컴퓨터의 개발에는 막대한 연구비가 필요한 것으로 알려져 있으며, 이런 이유로 IBM, 구글, MS 등의 개발 움직임이 주로 조명 받고 있음


Ø 그러나 양자 역학을 제대로 이해하고 있는 사람은 지구 상에 10명이 채 안될 것이라는 물리학자자 리차드 파인만의 말처럼, 양자 컴퓨터 개발은 기업 자체의 연구개발 만으로는 이루어질 수 없으며 양자 물리학 학계와 협업이 절대적으로 필요한 부분임


Ø 이 때문에 양자 물리학에 강점을 가진 대학들이 주목을 받고 있고 IT 대기업들도 다양한 방식으로 이들 대학과 협업 체계를 구축하고 있는데, 인공지능 연구와 마찬가지로 대학의 양자 역학 연구팀을 중심으로 한 스타트업이 향후 다수 출현할 것으로 예상됨


Ø 양자 컴퓨터는 컴퓨팅의 패러다임을 근본적으로 바꿀 뿐 아니라, 신소재 개발, 인공지능 등 정보기술은 물론 사회 전반에 혁신적 변화를 가져올 토대를 제공할 수 있다는 점에서 양자 컴퓨터의 주도권을 가지는 기업이 새롭게 IT 패권을 거머쥐게 될 것으로 예상됨


Ø IT 공룡들이 양자 컴퓨터에 투자를 아끼지 않는 것은 현재의 패권을 유지하기 위해서일 것이며, 리게티 같은 스타트업에도 막대한 투자 자금이 몰리는 것도 현재의 지형을 뒤엎을 수 있는 새로운 IT 강자의 출현이 양자 컴퓨터를 매개로 가능할 것으로 보기 때문



Ø 자율주행 자동차, 인공지능 분야와 마찬가지로 양자 컴퓨팅 분야에서도 대학의 순수과학 연구 자산이 새로운 비즈니스 탄생의 기반이 될 것으로 보이며, 기업과 대학의 협업 및 대학 기반의 스타트업 출현 등이 활발히 전개되며 본격적인 양자 컴퓨팅 시대의 개막이 더욱 앞당겨질 전망


Ø 양자 컴퓨팅 혁명이 예상보다 가까워지고 있다는 기대가 높아지는 가운데, 시장조사기관 마켓 리서치 퓨처는 2022년 양자 컴퓨팅 산업의 시장 규모를 24 6,400만 달러로 예상했으며 미국의 주요 플레이어로는 IBM, 인텔, 리게티 컴퓨팅 등 6개 기업을 꼽았음


<자료> Market Research Future


[그림 6] 2015~2022 양자 컴퓨터 시장규모 전망


※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1792호(2017. 4. 19 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

화가와 인공지능의 패스티쉬 대결 예술로 가는 AI.pdf



[ 요 약 ]


빈센트 반 고흐의 일생을 고흐의 화풍으로 그린 6 5천장의 유화 작품으로 구성한 독특한 장편 애니메이션 러빙 빈센트에는 고흐 풍의 유화 제작을 위해 115명의 화가들이 참여하였음한편 영화 제작 기간 동안 구글은 인공지능(AI)이 특정 화가의 스타일을 습득한 다음 주어진 사진을 그 화가의 화풍으로 그린 그림으로 변환해 주는 기술을 발표하였음. AI를 이용한 패스티쉬(작품 모방)가 가능해짐에 따라 향후 인간과 AI의 협업을 통한 새로운 사업기회 모색이 활발히 전개될 전망


[ 본 문 ]


ž 영국의 영화사 브레이크스루(BreakThru Productions)는 최근 2011년부터 100여 명의 화가와 함께 작업해 온 장편 유화 애니메이션 러빙 빈센트(Loving Vincent)의 예고편을 공개


<자료> BreakThru

[동영상] 러빙 빈센트 공식 예고편


Ø 러빙 빈센트는 빈센트 반 고흐가 그린 작품과 함께 그의 작품 속 인물들과 가상 인터뷰를 통해 고흐의 삶과 인생을 내레이션 하는 애니메이션 영화로 반 고흐가 죽기 전 8년간의 인생에 초점을 두고 있다고 함


Ø 러빙 빈센트는 개봉 전부터 많은 관심을 받고 있는데, 세계 최초로 영화와 예고편 영상의 러닝타임에 등장하는 모든 프레임을 고흐 스타일의 유화 작품으로 구성했기 때문


Ø 영화 제작사는 화가로서 인생을 산 10년 동안 일주일에 약 두 점씩, 860여 점의 그림을 그리며 불꽃 같은 삶을 살다 간 빈센트 반 고흐의 삶을 고스란히 전달하기 위해 고흐 풍의 유화 애니메이션 영화를 만들게 되었다고 설명


Ø 영화의 프레임에 사용된 유화는 6 5천 점으로 영상 1초에 12점의 그림이 연사 된다고 하는데, 이를 위해 2011년부터 115 명의 화가가 유화 작업에 참여했다고 함



<자료> Hugh Welchman


[그림 1] 러빙 빈센트의 프레임 작화 방법


Ø 영화의 제작 방식은 배우의 연기를 카메라로 촬영한 다음 각 장면을 화가들이 유화로 그리는 것인데, 이를 위해 화가들은 고흐의 작품 스타일을 학습한 후 동영상의 프레임을 고흐 풍으로 모사하였음


Ø 가령 영화 속 고흐의 모습은 [그림 1]에서 보듯 고흐 역을 맡은 폴란드의 배우 로버트 굴락칙을 그린 유화로 표현되는데, 이 때 유화의 스타일은 고흐의 작품 자화상에 사용된 붓 터치 방식을 모방한 것임


ž 한편 영화의 제작이 한창이던 2015 9월 흥미롭게도 구글은 인공지능(AI)이 화가의 작품 스타일을 습득하고, 주어진 사진을 화가의 화풍을 따른 그림으로 변환하는 기술을 발표


Ø 영화 러빙 빈센트가 카메라로 촬영한 장면을 작가들이 고흐의 화풍을 모방하여 그린 것처럼, 구글은 인공지능을 대상으로 고흐의 스타일을 학습시킨 후 입력된 사진을 보고 이를 고흐 화풍의 유화로 변환하게 하는 기술을 개발한 것임


Ø 포스트 모더니즘의 대표적인 기법인 패스티쉬(Pastiche)는 패러디와 달리 비판하거나 풍자하려는 의도 없이 기존의 텍스트를 무작위적으로 모방하는 것을 말하는데, 영화 러빙 빈센트가 패스티쉬 기법으로 만들어진 것이라면, 구글은 인공지능 패스티쉬 기술을 개발했다 할 수 있음


Ø 구글은 회화를 패스티쉬 하는 심층 신경망(Deep Neural Network)의 연구개발 성과를 예술 스타일의 신경 알고리즘(A Neural Algorithm of Artistic Style)이라는 제목의 논문으로 발표하였음


Ø 발표 직후 이 짧은 논문은 개발자들은 물론 기술을 잘 모르는 일반인들에게도 관심을 불러 일으켰는데, 개발자 커뮤니티인 깃허브 등에서는 논문의 실효성 검증을 위한 프로젝트들이 만들어졌으며, 실험 결과 사진의 내용은 보존한 채 질감만 바꿔 출력할 수 있음이 검증되었음


ž 구글의 심층 신경망에 사진을 입력하면 여러 가지 스타일의 그림, 즉 유명 화가 여러 명의 화풍을 모방한 여러 장의 그림들로 변환해 줌


Ø [그림 2]에서 보듯 상단 왼쪽의 사진을 입력하면 윌리엄 터너의 The Shipwreck of the Minotaur(미노타우르스호의 난파)' 스타일, 반 고흐의 The Starry Night(별이 빛나는 밤) 스타일, 에드바르트 뭉크의 The Scream(비명) 스타일, 파블로 피카소의 Seated Nude(앉아있는 나부) 스타일, 바실리 칸딘스키의 Composition (구성 Ⅶ)’ 스타일의 그림으로 사진을 재구성함



<자료> A Neural Algorithm of Artistic Style


[그림 2] 사진을 5개 화풍을 따른 그림으로 변환


Ø 심층 신경망은 Convolutional Neural Network(CNN, 나선형 신경망, 이미지 인식 기능)을 사용하고 있는데, 하나의 신경망이 두 가지 기능을 가지고 있어 입력된 사진을 변환하는 동시에 화가의 작품 스타일을 학습함


Ø CNN은 각각의 레이어가 특징 량(feature)을 가진다고 보며, 이 특징 량들이 계층적(hierarchy)으로 쌓이면서 더 높은 레이어로 갈수록 더 좋은 특징 량을 만들어 낸다고 보기 때문에, 일반적으로 이미지 인식에서 월등한 성능을 낸다고 알려져 있음


Ø [그림 3]은 CNN에서 서로 다른 두 가지 방법으로 스타일과 콘텐츠를 레이어 별로 재구성 하는 것을 보여주는데, 위쪽은 고흐의 별이 빛나는 밤 스타일을 레이어 별로 재구성 한 것이고, 아래쪽은 튀빙겐에서 찍은 사진의 콘텐츠를 레이어 별로 재구성 한 것임


Ø 스타일 재구성에서 알 수 있는 것은 레이어가 얕을수록 원래 콘텐츠 정보는 거의 무시하고 질감(texture)을 복원하는 반면 깊은 레이어로 갈수록 점점 원래 콘텐츠 정보가 포함된다는 것으로, 현격한 특징 량을 추출하여 회화의 터치 등 화가의 스타일을 파악함


Ø 콘텐츠 구성을 보면, 낮은 레벨의 레이어는 거의 완벽하게 원본 이미지를 보존하고 있지만, 레이어가 깊어질수록 원본 이미지의 정보는 조금씩 소실되지만 가장 중요한 하이 레벨의 콘텐츠는 거의 유지가 되는 것을 볼 수 있음


Ø 논문은 이처럼 동일한 CNN이라 하더라도 콘텐츠와 스타일에 대한 재현이 분리가 되어 있다는 점을 중요하게 내세우고 있는데, 이를 통해 하나의 신경망을 이용해 서로 다른 이미지에서 서로 다른 콘텐츠와 스타일을 재구성하고 이 둘을 섞는 것이 가능한 것임


<자료> A Neural Algorithm of Artistic Style


[그림 3] 나선형 신경망(CNN)을 통한 스타일과 콘텐츠의 재구성 프로세스


ž 이후 구글은 CNN 기술을 보다 강화하여 새로운 논문을 추가로 발표하였는데, 이 논문은 이후 많은 스타트업들의 패스티쉬 앱 출시로 이어지게 되었음


Ø 구글이 기술을 강화해 발표한 후속 논문 A Learned Representation for Artistic Style(예술 스타일을 위한 학습된 재현)은 하나의 신경망으로 32 가지 스타일의 패스티쉬를 생성할 수 있는 프로세스를 소개하고 있음


Ø 또한 이 신경망은 입력된 이미지의 재구성을 실시간으로 실행하기 때문에 영상을 입력하면 재구성 된 영상이 출력되는데, 만일 러빙 빈센트 영화의 제작에 이 기술을 이용했다면 115명의 화가가 수만 장의 그림을 그릴 필요가 없었을 지도 모름


Ø 구글은 이 기술을 개발한 이유에 대해 새로운 예술의 문을 열기 위해서라고 밝히고 있으며, 화가의 스타일을 학습한 신경망은 스마트폰 앱으로 이용할 수 있을 것이라 말했음


Ø 실제로 이후 다수의 벤처기업들이 패스티쉬 앱을 출시하고 있는데, 그 중 가장 주목받은 앱은 프리즈마(Prisma)2016년 여름에 출시된 이후 5천만 다운로드를 기록하고 있음


Ø 프리즈마는 사진을 필터링 하거나 편집하는 앱과는 구조가 근본적으로 다른데, 구글의 CNN 기법을 사용하고 있어 AI가 사진을 분석한 후 학습된 유명 화가의 스타일로 재구성하며 사진을 회화의 예술로 다시 태어나게 함


Ø 사진을 입력한 후 원하는 회화 스타일을 선택하면 사진이 그림으로 변환되는데, 가령 몬드리안 스타일을 선택하면 사진이 가로 세로로 분할된 빨강, 파랑, 노랑의 삼원색으로 재구성됨



[그림 4프리즈마 앱의 몬드리안 스타일 변환


Ø 한편 최근 애플은 클립(Clips)이라는 자체 앱을 선보였는데, 이는 프리즈마 앱과 유사한 기능을 제공하기 위한 것으로 패스티쉬 앱의 인기가 일회성이 아님을 보여주는 반증이기도 함


ž 패스티쉬 앱은 새로운 예술 영역을 구축했다는 평가와 예술가들의 입지를 축소시킨다는 우려를 동시에 낳고 있는데, 예술 분야 역시 인간과 AI의 공존을 위한 모색이 필요할 전망


Ø 패스티쉬 앱의 보급과 함께 패스티쉬 팬도 크게 늘고 있는데, 인스타그램에는 프리즈마로 생성한 패스티쉬 작품이 다수 포스팅 되고 있음


Ø 아무 사진이나 변환한다고 해서 회화 예술이 되는 것이 아니지만 인스타그램에는 볼 만한 패스티쉬 작품이 다수 게재되어 예술의 새로운 영역을 구축하고 있다는 평가도 나오고 있으며, 매력적인 사진이 많은 인스타그램은 프리즈마로 회화의 즐거움이 더해져 더욱 풍부해지고 있음


Ø 반면, AI가 예술가의 일을 빼앗는 게 아니냐는 우려도 확산되고 있는데, AI가 동영상 패스티쉬도 생성할 수 있기 때문에 향후 러빙 빈센트 같은 애니메이션 영화가 추가로 제작된다면 예술가들이 불필요하게 될 것임을 지적하는 사람도 많음


Ø 이런 우려에 대해서는 예술가들이 패스티쉬를 제작하는 기계적 작업에서 해방되어 자신만의 창작 활동에 전념하게 될 것이라는 긍정적 반론도 있음


Ø AI는 반드시 모방할 원본을 필요로 하고 스스로 작품을 만들어내는 것은 아니기 때문에 복사의 범위를 벗어나지 못한다는 것이며, 결국 예술은 인간의 독창성에서 태어난다는 주장임


Ø 물론 이런 주장에 대해서는, 가령 알파고가 인간의 기보를 분석한 것이 아니라 알고리즘 스스로 만들어 낸 기보의 학습을 통해 인간 최고수를 꺾은 것처럼, 예술의 창작 역시 온전히 사람의 전유물이 아니며 AI도 얼마든지 창작 역량을 가질 수 있다는 재반론도 있음


Ø 이런 논란은 결국 회화 예술 분야 역시 인공지능과 인간의 협력, 또는 인간의 창작활동을 위한 AI의 지원 같이 인간과 AI이 공존을 위한 새로운 길의 모색이 필요할 것임을 시사


ž 예술가와 AI의 협업 모델 구축은 향후의 중요 과제로 남겠지만, 패스티쉬를 생성하는 AI를 이용한 새로운 비즈니스 창출 시도는 앞으로 활발히 전개될 예상됨


Ø 러빙 빈센트의 예에서 보듯 인간 예술가들이 수 년에 걸쳐 직접 패스티쉬를 만들기 보다 이를 AI에 맡겨 제작한다면 제작 시간을 단축 할 수 있게 되므로, AI는 우선 애니메이션 영화 제작 비즈니스에서 큰 잠재력을 가진 것으로 볼 수 있음


Ø 미야자키 하야오 같은 유명 애니메이션 아티스트의 스타일을 AI가 학습한다면, 아마 미야자키 하야오 감독의 은퇴 이후 인간이 아닌 AI가 감독의 영향을 가장 강하게 받은 후배로서 애니메이션 영화 제작을 주도할 수도 있을 것임


Ø 실제 프리즈마 앱은 이미 애니메이션 스타일로 변환하는 옵션도 제공하고 있어 이런 상상이 전혀 허황된 것은 아니며, 앞으로 애니메이션 창작 활동에서 인간과 AI가 담당해야 할 작업의 식별과 효과적 자원 배분은 영화 비즈니스의 핵심성공요소가 될 가능성이 높음


<자료> YouTube

[동영상] 프리즈마 앱의 애니메이션 생성 기능


Ø 영화 산업은 AI의 도입에 비교적 적극적인 산업의 하나로 이미 AI가 대본에 주도적으로 참여한 영화의 제작이 이루어지고 있으며, AI가 작곡한 음악을 영화의 배경음악(BGM)으로 사용하는 방안이 논의되고 있기 때문에 향후 적극적인 인간-AI의 협업 모델이 모색될 것으로 전망

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1784호(2017. 2. 22 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

영업실적으로 증명된 페퍼 로봇의 도입효과.pdf



◈ 소프트뱅크는 2월 초 휴머노이드 로봇 페퍼(Pepper)의 기업 업무 활용을 주제로 한 컨퍼런스 페퍼 월드 2017(Pepper World 2017)을 개최


기조 연설에 등단한 소프트뱅크의 로보틱스 그룹 대표는 로봇의 도입이 실제로 얼마나 효과가 있는지, ROI에 영향을 미치는지를 보다 명확히 입증하기 위해 2017년에는 인간과 로봇의 협업을 테마로 서비스, 영업, PR 등의 분야에 집중하겠다고 발표


소프트뱅크에 따르면 지금까지 기업용 로봇인 Pepper for Biz를 도입한 기업은 약 2,000개 사로, 페퍼는 일본이 로봇 시장을 선도하는데 큰 기여를 하고 있음


페퍼의 외국 진출도 가시화되고 있어 대만의 폭스콘(Foxconn) 및 중국의 알리바바와 조인트 벤처로 사업을 전개할 예정인데, 소프트뱅크는 국가나 지역 별로 로봇 목소리의 톤이나 선호 캐릭터 등이 다르기 때문에 이와 관련한 연구를 계속 진행해 오고 있다고 함


다른 로봇과 경쟁 상황에 대해서도 언급했는데, 전세계에 출시된 로봇을 모든 체크하고 있지만 페퍼가 압도적으로 뛰어난 것으로 자평한다며, 그러나 최고의 로봇은 연구소 독자적으로 만들 수 없기 때문에 지속해서 고객의 요구에 맞게 발전시켜 나가겠다고 밝힘


◈ 기업의 페퍼 도입 필요성과 관련해 소프트뱅크는 싱귤래리티(Singularity)를 키워드로 제시했는데, 싱귤래리티를 위한 기술 요소 중 하나가 로봇이 될 것이라 설명


소프트뱅크는 2010년에 전 직원이 참여한 토의를 통해 30년 후를 내다본 사업 분야로 로봇을 선택하게 되었다고 하며, 2011년에 프로젝트를 시작해 2014년에 페퍼를 선보였고, 2015에 기업을 대상으로 한 Pepper for Biz 사업을 시작하였음



• 싱귤래리티는 로봇(컴퓨터)과 인간 사이에 현격한 지능의 차이가 발생하는 지점을 의미하는데, 소프트뱅크는 싱귤래리티의 요소 기술로 인공지능(AI), IoT, 로봇을 꼽고 있으며, 기업이 이들 세 요소를 사업 현장에서 어떻게 살려 나가느냐가 기업 경쟁력의 관건이 될 것으로 보았다고 함



<자료> My Navi News.


[그림 1] 싱귤래리티의 3가지 요소


소프트뱅크는 페퍼 로봇을 AI IoT에 생기를 불어 넣어 싱귤래리티로 도달하게 하는 도선사라 묘사하며, 기업이 싱귤래리티를 사업에 활용하는데 로봇이 매우 중요하다고 설명


◈ 페퍼 도입의 효과에 대해서는 실제 업무에 도입하고 있는 기업들이 등단해 설명했는데, 가장 대표적인 활용 분야는 고객 응대와 영업, 마케팅 분야임


외식 기업인 젠쇼 그룹은 식당 방문 손님에게 자석 위치를 안내하는 일을 페퍼에게 맡기고 있는데, 당황하는 고객이 있어 종업원이 직접 안내해 주는 일도 있었지만 곧 익숙해졌으며, 앞의 고객이 잘 반응하면 뒤에 줄 서 있는 고객들이 쉽게 이해하는 것 같다고 평가



[동영상] 초밥집 좌석 위치를 안내해 주는 페퍼 로봇


소프트뱅크 매장의 활용 사례도 소개되었는데, 페퍼의 유용한 점은 새로운 상품과 서비스에 관한 설명을 직원이 하면 영업 색채가 강해져 거부감을 주기도 하나 페퍼가 하면 자연스러운 인상을 주는 것이라고 함


실제로 소프트뱅크 카드와 스마트 로그인 상품의 경우 페퍼가 설명을 했을 때 계약 체결 수가 약 2배 증가했다고 함




배스킨라빈스는 매주 금요일 아이스크림을 무료로 주는 이벤트에 매장 별로 1천명 이상씩 몰리자 식음료 업계의 고질적 문제인 인력 부족을 해결을 위해 페퍼를 도입했다고 소개


사람과 달리 페퍼는 항상 고객에게 상냥하게 응대하며, 쿠폰을 받는데 필요한 스마트폰의 조작법 안내를 자세히 해주기 때문에 효용성이 크다고 설명


페퍼 도입 후 쿠폰 배포 수가 크게 증가했다고 하는데, 쿠폰을 직원에게 받으면 눈치를 보는 면이 있으나 페퍼라면 그런 걱정이 없기 때문이며, 사람들이 심리적 스트레스를 받지 않는 것 같고, 결과적으로 브랜드에 대한 마음의 벽이 없어지는 효과가 있다고 분석


크리스마스 케이크 판매량도 페퍼가 없는 점포에서는 전년 대비 마이너스 6.3% 포인트를 기록한 반면, 페퍼를 도입한 매장은 8.5% 포인트 증가했다고 함




◈ 페퍼는 보다 전문적인 업무에 투입되고 있기도 한데, 의료분야에서는 질병의 증상을 검사하는 업무를 수행하고 있기도 함


쇼난 아츠 병원은 처음에는 페퍼를 시설 안내 및 재활 보조, 이벤트 등에 활용했지만, 새롭게 질병 인지에 활용 중이라고 함


수면 무호흡증(코골이)과 관련해 남성 환자를 대상으로 페퍼에게 소리 청취를 맡겼는데, 검사를 희망하는 환자가 증가하는 등 성과가 있었고 의사가 이를 활용하고 있다며, 향후 다른 진료과 및 산하 의료기관에도 확산시켜 나갈 것이라 밝혔음

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1778호(2016. 12. 28 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

풀이과정을 알 수 없는 인공지능에 대한 신뢰성.pdf



[ 요 약 ]


딥러닝(Deep Learning)을 응용한 시스템의 활용이 사회 각 분야로 확산되고 있으나, 동시에 AI의 문제점도 명확히 드러나고 있음. 문제 제기의 핵심은 AI를 믿을 수 있는가 하는 것인데, 이는 AI의 결정 메커니즘을 사람이 온전히 알 지 못한다는 점에서 기인함. 의사보다 암 진단 정확도가 높지만, AI가 왜 그렇게 판단했는지를 모르기 때문에 신뢰성의 문제가 제기되는 것이며, 따라서 2017년에는 AI의 작동 메커니즘을 규명하려는 움직임이 적극 전개될 것으로 예상



[ 본 문 ]


◈ 인공지능(AI) 활용 시도가 다양하게 전개되면서, 사람들은 점차 인공지능(AI)을 과연 신뢰해야 하는가라는 문제에 직면하고 있음


딥러닝(Deep Learning) 기법을 응용한 다양한 인공지능 시스템 활용 사례가 속속 소개되며 기대감이 커지고 있으나, 동시에 AI의 문제점도 명확해지고 있음


AI는 통계학적 수법을 통해 입력된 데이터로부터 어떤 특징의 양을 정밀하게 감지하며 의사결정을 내리는데, 사람들을 곤혹스럽게 하는 점은 AI가 왜 그런 의사결정을 내렸는지에 대해 설명해 주지 않기 때문임


가령 자율운전 차량은 인간보다 훨씬 안전하게 주행할 수 있다는 것이 실험을 통해 입증되고 있지만 그 운전 기술의 요체는 AI 개발자들도 모르며 오직 AI만 알고 있기에, 사람들은 안전할 거 같긴 한데 믿을 수 있을까라는 애매한 감정을 갖게 됨


구글 딥마인드는 바둑 인공지능 알파고를 개발하며 바둑의 규칙조차 입력하지 않았지만, 대결에서 패한 인간 최고수로부터 바둑을 이해하는 새로운 관점을 얻게 되었다는 찬사를 이끌어 냈는데, 이런 사실에 사람들은 기대감과 불안감을 동시에 느끼는 것


사정이 이렇다 보니 사람들이 느끼는 불안감 속에는, 사람이 AI를 이해하지 못하는 것이 아닌지, AI가 사람을 능가하는 것은 아닌가 하는 존재론적 의심도 배어 있음


AI에 내포된 이런 본질적 문제는 다양한 형태로 드러나고 있는데, 중국계 AI 연구자들이 최근 발표한 얼굴 특징으로 범죄자를 식별하는 기술은 큰 논란을 낳고 있음


상하이교통대학(Shanghai Jiao Tong University)은 지난 11 13얼굴 이미지를 이용한 범죄연관성에 관한 자동화된 추론(Automated Inference on Criminality using Face Images)이라는 논문을 공개


공개된 지 얼마 안되어 아직 피어 리뷰(동료 전문가 평가, peer review)도 끝나지 않았지만, 논문에 따르면 알고리즘은 89%의 정확도로 범죄자를 식별한다고 하는데, 즉 얼굴 사진을 알고리즘에 입력하면 그 사람이 범죄자인지 여부를 거의 알 수 있다는 것


이 연구에는 딥러닝 등 얼굴인식 AI 기술이 사용되었으며, 알고리즘을 훈련시키기 위해 남성 1,856명의 얼굴사진을 사용했고 그 중 730명이 범죄자였다고 함




<자료> Xiaolin Wu & Xi Zhang


[그림 1] 얼굴인식 AI 기법을 이용한 범죄자 식별 가능성 연구


• 논문은 범죄자의 얼굴에 세 가지 특성이 있다고 언급하고 있는데, 윗입술의 선이 보통 사람에 비해 급격히 내려가고(그림1 오른쪽 이미지 속의 p), 두 눈의 간격이 좁으며(d), 코와 양 입가 사이에서 만들어지는 각도가 좁다(θ)는 점을 들고 있음


이 논문은 현재 논란의 와중에 있는데, 인물의 행동에서 범죄자를 식별하는 방법은 이미 감시 카메라 등으로 사용되고 있지만, 얼굴의 특징으로 범죄자를 가려낸다는 AI를 믿을 수 있는가 하는 의문이 제기되고 있는 것


AI는 학습 데이터를 바탕으로 통계 처리를 하는 것이지, 얼굴의 모양과 범죄자를 연결시키는 논리가 아닌데, 만일 AI가 범죄 수사에 사용된다면 일반 시민들이 이유를 알지 못한 채 용의 선상에 오르게 될 지도 모른다는 우려가 나오고 있음


◈ 딥러닝이 사회문제가 될 수 있는 불씨는 도처에 도사리고 있는데, 세계 최첨단 AI 기술력을 보유한 구글 역시 AI와 관련해 인종차별 이슈로 문제점을 지적받고 있음


구글의 유튜브는 청각 장애인을 위해 동영상 속의 음성을 자막으로 표시하는 기능이 있는데, 구글은 이 기능에 AI를 사용하고 있음


미국국립과학재단(National Science Foundation)의 레이첼 태트먼(Rachael Tatman) 연구원은 유튜브의 캡션 기능에서 동영상 속 화자가 남성일 경우와 여성일 경우 캡션의 정확도가 다르지 않은가에 대해 조사를 실시하였음


<자료> Rachael Tatman.


[그림 2] 구글 음성인식의 성별 편견


• 그 결과 유튜브는 남성의 목소리를 여성의 목소리보다 정확하게 인식하는 것으로 나타났는데, 남성일 경우 인식 정확도는 60%이지만, 여성의 목소리일 경우 정확도는 47%로 내려가 음성인식에서 여성이 차별을 받고 있는 것으로 나타남


이 차이가 발생하는지에 대해 시스템을 자세히 검증할 필요가 있는데, 태트먼은 AI 훈련에 사용된 음성 데이터 샘플이 성별로 균등하지 않고 남성에 치우쳤기 때문인 것으로 추측


AI의 성능은 훈련 자료의 품질에 민감하게 좌우되는데, AI의 여성 차별과 인종 차별 문제가 표면화됨에 따라, 훈련 데이터의 공정성 여부가 추궁 당하고 있음


◈ 사람의 생명과 직결되는 의료 분야에서도 인공지능에 의한 판단과 결정을 어떻게 해석하고 검증할 것인지에 대한 논의가 시작되고 있음


딥러닝 기법은 최근 유방암 검사의 판정에서 성과를 올리고 있는데, 검체의 의료 이미지(CT 촬영사진, x-레이 사진 등)를 딥러닝 네트워크에 입력하면 AI는 암이 발병한 조직을 정확하게 검출해 냄


현재 AI의 유방암 진단 정확도가 인간을 웃돌기 때문에, 많은 병원에서 정밀한 치료를 위해 이 시스템의 도입을 시작하고 있음


그러나 동시에, 건강해 보이는 조직을 AI가 암 발병 가능성이 높다고 판정한 경우, 의사와 환자가 어떻게 대응해야 할 지가 논란이 되고 있는데, AI 판정만 믿고 몸을 여는 수술을 해야 하는지 어려운 판단을 내려야 하는 압박을 받게 됨


물론 유전자 검사에서도 동일한 문제가 발생하고 있으며, 유방암 발병을 촉진하는 유전자 변이인 BRCA가 검출될 경우 수술을 해야 하는지 여부가 논란이 되고 있음


여배우 안젤리나 졸리는 BRCA1 변이 유전자를 보유하고 있으며 유방암 발생 확률이 87%라는 말을 듣고 아직 암이 발병하지 않았음에도 유방 절제술을 받은 바 있음


그러나 AI에 의한 검진의 경우는 이와 다른데, AI는 변이 유전자 보유라는 확실한 근거를 토대로 발병 확률을 제시하는 것이 아니며, 통계적 방법으로 유방암 여부를 판단할 뿐 그 조직에서 왜 암이 발병하는 지는 설명하지 않기 때문


이런 이유로 인공지능은 종종 인공 무능으로 조롱받는 것이며, 과학적 근거가 없는 결정을 어떻게 해석해야 할 지에 대해 의학적 검증 노력이 시작되고 있음


◈ 은행이나 핀테크 스타트업들도 최근 대출 심사에서 딥러닝을 사용하기 시작했는데, 심사 결과에 대해서는 대체로 만족도가 높지만 현행 법과 배치되는 문제가 발생하고 있음


AI 대출 심사의 장점은 신청자의 데이터를 알고리즘에 입력하면 즉시 위험도를 평가할 수 있고 높은 정확도로 단시간에 대출 심사가 할 수 있다는 것


한편, 미국 대부분의 주 정부는 은행이 대출 심사를 통과하지 못한 사람에게 그 이유를 설명하도록 의무화 하고 있는데, 딥러닝은 그 과정이 깜깜이여서 은행은 탈락한 신청자에게 이유를 충분한 설명하지 못하게 됨


게다가 대출 심사 기준을 바꿀 때마다 알고리즘을 재교육하는데, 소프트웨어의 로직을 변경하는 것이 아니라 대량의 데이터를 읽어 들여 딥러닝의 변수를 다시 설정하게 하기 때문에 금융업계에서 AI 도입을 두고 찬반 논란이 일고 있음


AI의 작동 알고리즘을 정확히 알지 못할 경우, 경험적으로 알게 된 AI 알고리즘의 맹점을 활용한 공격에 인증 시스템이 오작동 할 위험이 있음을 증명하는 실험도 있음


카네기 멜론 대학의 마무드 샤리프 교수 등은 안경으로 얼굴 인증 시스템이 오작동하도록 만들 수 있다는 내용을 담은 논문 최신 얼굴 인식 기술에 대한 실제적이고 눈에 띄지 않는 공격(Accessorize to a Crime: Real and Stealthy Attacks on State-of-the-Art Face Recognition)을 발표하였음


실험에 의하면 안경테의 폭이 약간 넓은 안경을 쓰면 시스템이 얼굴을 인식할 수 없게 되며, 따라서 방범 카메라의 감시 시스템을 빠져 나갈 수 있는 여지가 생김


<자료> Mahmood Sharif et al..


[그림 3] 간단한 트릭으로 얼굴인식 AI 교란


• 또한 안경테의 색 패턴을 변경하면 얼굴 인식 시스템이 다른 인물로 오인하는 것으로 나타났는데, 현란한 색의 종이로 만든 안경테를 걸치면 심지어 남성을 여성으로 잘못 인식하는 경우도 있었다고 함


얼굴 인식 시스템이 딥러닝 기법으로 얼굴의 특징을 파악한다고 하는데, 이 사례를 보면 눈매의 이미지를 판정에 사용하는 것으로 추정해 볼 수 있음


그러나 AI가 실제로 어떤 논리로 얼굴 인증을 하고 있는지는 아직 수수께끼이며, 이것이 규명되지 않는 한 얼굴 인증 시스템을 손쉽게 빠져 나가는 범죄자의 트릭을 막을 방법이 없음


AI의 작동 메커니즘이 알려지지 않는 이유는, AI의 기초를 이루는 신경망이 인간의 뇌를 본떴기 때문인데, 인간 뇌의 정보 저장 방식이 아직 밝혀지지 않았기 때문


AI의 신경망(Neural Network)으로 이미지를 판정할 때는 사진과 태그를 네트워크에 입력한 후 출력이 제대로 사진의 내용을 판정할 수 있도록 훈련시키는 과정을 거침


• 훈련 과정에서는 네트워크의 각층 사이의 연결 강도(Weight)를 조정하는데, 이러한 교육 과정은 인간의 뇌가 학습 할 때 뉴런의 연결 강도를 조정하는 움직임과 유사한 것으로 알려져 있음


학습에서 얻은 연결 강도는 각 뉴런(그림 4의 흰색 동그라미 부분)에 저장되는데, 따라서 신경망을 훈련시키는 메커니즘의 특징은 프로그램과 데이터를 한 곳에 모아 저장하지 않고 학습 데이터를 네트워크에 분산하여 저장할 수 있다는 것임


<자료> Neural networks and deep learning.


[그림 4] 인공지능 신경망의 정보 저장 구조


인간의 뇌도 동일한 방식으로 작동하는데, 가령 뇌가 전화번호를 기억할 때, 첫 번째 숫자는 다수의 시냅스에 흩어져 저장되며, 두 번째 숫자도 마찬가지로 흩어져 저장되지만 첫 번째 숫자와 가까운 위치에 저장되는 것으로 알려져 있음


문제는 뇌의 이런 저장 메커니즘이 아직 정확히 밝혀지지 않았고, 따라서 뇌의 구조를 본 뜬 신경망의 정보 저장 메커니즘의 규명이 진행되지 못하고 있다는 점


딥러닝의 문제점은 응축하자면 지식이 네트워크 상에 눌어붙어 있다는 점에서 기인하는데, 즉 지식이 수천만 개에 이르는 뉴런에 흩어져 저장되기 때문에 시스템을 개발한 인간이 아니라 네트워크가 지식을 습득한다는 데 문제의 본질이 있음


AI만이 알고 있는 답을 규명하기 위해 1990년대 초부터 연구자들이 AI의 블랙박스를 열려는 시도를 해왔는데, 규명의 과정이 곧 AI에 대한 의구심이 높아지는 과정이었음


카네기 멜론 대학은 1990년대부터 자동운전 기술의 기초 연구를 진행하고 있었는데, 당시 연구원 딘 포모루는 카메라에 포착된 영상으로 자동운전 알고리즘을 교육시켰음


몇 분간 알고리즘을 교육한 후 차량을 자동 주행시키는 시험을 반복했는데, 시험은 잘 진행되었지만 다리에 접근할 때 자동차는 도로에서 벗어나는 움직임을 보였고, 그러나 알고리즘이 블랙박스여서 그 원인을 알 수 없었음


소프트웨어를 디버깅하는 방법으로는 로직을 수정할 수 없기 때문에 포모루는 도로 도로주행 시험을 반복하며, 다양한 상황에서 자동운전을 반복하며 경험적으로 문제점을 밝혀낼 수밖에 없었음


그에 따르면 자동차는 갓길 바깥에 나있는 잔디 부분을 기준으로 주행 도로를 판정하고 있는 것으로 파악되며, 다리에 가까워지면 잔디 부분이 없어져 차로 판단 기준을 잃게 되므로 정상적인 주행을 할 수 없게 된 것임


이런 결론에 이르게 되자 포모루는 자동운전 기술을 AI로 구현한 자동차가 과연 제대로 작동할 것인지 확신할 수 없게 되었다고 함


◈ 현재에도 이와 동일한 문제에 직면하고 있는데, 무인 자율운전 차량들이 도로를 달리고 있는 지금, 사람이 AI 기술을 신뢰해야 할 지의 문제가 최대 이슈가 되고 있음


AI의 운전 로직을 모르기 가운데, 어떻게든 안전 기준을 만들려다 보니 시행착오가 계속되고 있는데, 그 중 하나는 정해진 거리를 무사고로 주행 가능하다면 안전한 것으로 간주한다는 생각임


싱크탱크 랜드 코프(Rand Corp)는 인간이 자동차를 1억 마일 운전할 때 사망 사고는 1.09 회 발생하는데, 자율운전 차량이 인간만큼 안전하다는 것을 증명하기 위해서는 2.75억 마일을 무사고로 달릴 필요가 있다는 기준안을 제시한 바 있음


인간 수준의 안전성을 입증하기 위해서는 대규모 주행 시험이 필요하다는 말인데, 이는 자율운전 자동차의 안전 기준을 설정하는 작업이 난항을 겪고 있음을 잘 보여줌


◈ 그러나 자율주행 차량의 도입과 확산을 위해서는 결국 AI의 작동 메커니즘 규명이 반드시 전제되어야 할 것이므로, 이 문제를 기술적으로 해명하려는 움직임도 시작되었음


엔비디아(Nvidia)는 딥러닝을 이용한 자율운전 기술을 개발하고 있는데, 이 시스템의 명칭은 데이브-2(DAVE-2)이며 신경망으로 구성되어 있음


인간이 알고리즘에 주행 규칙을 가르치는 것이 아니라, 시스템이 신경망에서 이미지를 처리하여 안전한 경로를 파악하는데, 가령 곡선 도로의 이미지를 읽으면서 거기에서 운전할 때 알아야 할 필요가 있는 도로의 특징을 파악함


엔비디아는 AI가 어떤 기준으로 결정하고 있는지에 관한 연구를 함께 진행하고 있는데, 지금까지 블랙박스였던 AI의 핵심을 규명하는 시도임


• 연구의 결과, 엔비디아는 카메라가 포착한 사진과 이미지 인식 신경망(CNN)이 이것을 읽고 거기에서 추출한 특징을 비교해서 보여주며, AI가 도로를 어떻게 이해하고 있는지를 설명하고 있음


신경망이 보여 주는 굽은 도로의 특징을 보면, 특징량은 곡선이 대부분으로 CNN이 도로의 경계 부분을 기준으로 운전하고 있음을 알 수 있는데, 이런 방법을 통해 AI가 습득한 운전 기술의 요체를 사람이 시각적으로 이해할 수 있다는 설명



<자료>Nvidia.


[그림 5] AI가 도로를 인지하는 방법



2016년이 인공지능의 가능성을 열어젖힌 원년이라면, 2017년은 AI의 블랙박스를 열어 그 작동 논리를 규명함으로써 AI 확산의 기폭제를 마련하는 해가 될 것으로 예상


자율운전 자동차를 포함 자율적 인공지능 시스템은 심층강화학습(Deep Reinforcement Learning)이라는 기법을 사용하여 알고리즘이 시행착오를 반복하여 정책을 학습하도록 하고 있음


심층강화학습 기법은 알파고에도 사용되고 있으며, 보다 지능적인 AI 개발의 핵심 기법이 될 것으로 보이는데, 현재 심층강화학습의 요체도 블랙박스이지만, 앞으로 이에 대한 규명 작업도 적극 진행될 것으로 예상됨


무언가 새롭고 획기적인 것인 등장했을 때, 그것의 요체와 작동 방식을 정확히 모른다면 사람들의 대응 방식은 무조건적인 거부 혹은 반대로 종교와 유사한 무조건적 추종과 같은 극단적 양상을 띨 위험이 있음


인공지능이 사회적 합의 위에 다양한 가치를 위해 활용되려면, 그 메커니즘에 대한 정확한 이해가 수반되어야 할 것이며, AI가 인간의 뇌를 본 뜬 것인 만큼, AI를 알아가는 과정은 곧 우리 인간이 스스로에 대해 더 많이 알게 되는 과정이 될 수 있을 것임

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1776호(2016. 12. 14 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

인공지능 접목으로 유연성 높아지는 보안시스템.pdf



[ 요 약 ]


지금까지 보안 시스템은 새로운 해킹 수법이 등장하면 이를 최대한 신속하게 감지하고 대응책을 마련한 후 배포하는 수동적 방식이었음. 그러나 최근 인공지능(AI) 기술이 발전하고 활용 범위가 넓어지면서 보안 분야에서도 AI를 접목하려는 시도가 활발히 전개되고 있는데, 바둑 AI 알파고와 유사한 방식으로, 인공지능에 대규모의 침해 패턴을 학습시킴으로써 스스로 방어 규칙을 생성하여 신속히 대처할 수 있는 유연한 보안 시스템을 구축하려는 노력이 대표적



  [ 보 안 ]

 

  ◈ 기계학습의 발전에 따라 보안 시스템에 대한 훈련이 쉬워지게 되었고, 그 결과 보안 시스템은 상황의 변화에 이전보다 유연하게 대응할 수 있는 환경을 갖추게 되었음


보안 솔루션들에서 한가지 공통적인 태스크는 새로 다운로드 받거나 설치한 응용프로그램의 악성 여부를 판정하는 것임


지금까지의 접근 방식은 지극히 기본적인 일종의 전문가 시스템으로, 응용프로그램의 서명이 그 동안 알려진 멀웨어의 패턴과 일치하는지 여부를 조사하는 것임


하지만 이러한 표준적인 바이러스 대응 방식은 약점이 있는데, 새로운 멀웨어의 출현에 맞춰 지속적으로 업데이트가 필요하다는 점과 틈이 생기기 쉽다는 점


, 멀웨어에 아주 작은 수정만 가하더라도 감지 기능을 쉽사리 빠져나가기 때문에 시스템이 침투당하게 되는 약점이 있음


◈ 딥러닝(Deep Learning)의 방법으로 이런 약점을 해결하는 것을 목표로 하고 있는 스타트업 중 주목받고 있는 곳 중 하나는 이스라엘의 딥 인스팅크트(Deep Instinct)


보안 시스템의 훈련에 사용할 수 있는 멀웨어 표본 중 지금까지 알려진 것은 약 10억 개에 이르는데, 딥 인스팅크트는 이를 활용한 문제 해결을 시도하고 있음


딥러닝은 다양한 분야에 혁명적인 변화를 가져오고 있는데, 가령 컴퓨터 비전은 매년 20~30%의 진화를 이루고 있으며, 인간의 영역을 넘어서는 시각적 능력에 이르는 것도 시간문제라는 전망이 나오고 있음


음성인식 분야 역시 딥러닝을 통해 급속한 발전을 이루고 있는데, 이와 같은 일이 사이버 보안 영역에서도 일어나지 않을 이유가 없다는 것이 딥 인스팅크트의 출발점


물론 이 스타트업은 확률 기반의 기계학습 시스템에도 한계는 있다고 말하고 있는데, 우선 최적의 결과를 내기 위해 인간 전문가가 식별하고, 가중치를 두고, 튜닝해야 할 많은 요소들이 너무 많이 있다는 것


<자료> CIO


[그림 1] AI 진화의 3단계(기계학습 시스템이 개와 고양이를 구분하는 방식의 진화)


• 반면 역시 셀 수 없는 많은 요소들이 너무 사소하거나 관련이 없는 것으로 버려지고 있는데, 딥 인스팅크트는 대부분의 데이터가 버려지고 있다고 보고 있음


◈ 딥 인스팅크트가 채택한 방식은 멀웨어로 알려진 표본 모두를 이 기업 연구소의 딥러닝 시스템에 훈련시키는 것임


이 훈련 과정에는 약 하루가 소요되고 데이터 분석에는 고성능 GPU가 필요한데, 훈련 결과 얻게 되는 시스템 크기는 약 1 기가바이트로 대부분의 응용프로그램에 사용하기에는 너무 크기 때문에, 이 기업은 약 20 메가바이트 정도로 크기를 줄였음


그 결과, 모바일을 포함한 모든 최종 단말 장치에 설치할 수 있게 되었으며. 처리 속도가 느린 장치에서도 침입해 오는 위협을 몇 밀리 세컨드 안에 분석 가능하게 되었음


보통의 파일 크기는 1 메가바이트 가량이기 때문에 탐지와 분석에는 1 밀리 초도 채 걸리지 않는데, 복잡한 처리는 연구소의 첨단 인프라에서 수행되고 고객 쪽에 설치되는 것은 매우 작은 처리장치이며, 고객들이 모든 복잡한 부분을 다 보는 것은 아님


<자료> Deep Instinct


[그림 2] 딥 인스팅크트의 딥러닝을 이용한 보안 시스템


• 반면 연구소에서는 새로운 멀웨어 표본 데이터를 축적하고, 3~4 개월마다 최종 단말의 각 장치에서 작동하는 두뇌에 업데이트를 일괄 배포하는데, 흥미로운 점은 두뇌를 6개월간 업데이트 하지 않더라도 새로운 멀웨어 파일을 탐지할 수 있다는 것


◈ 공격자가 수정을 가해 새로운 멀웨어 변종을 만들어 내더라도 탐지에 전혀 문제가 없다는 점이 바로 보안 시스템에서 기계학습 방식의 매우 우수한 장점임


매일 엄청난 수의 새로운 멀웨어 표본이 출현하고 있지만, 그 대부분은 기존의 멀웨어를 극히 경미하게 변화시키고 있을 뿐임


실력 있는 공격자나 국가 주도로 새로운 제로-데이 공격을 하더라도 80%는 기존의 공격과 같은데, 지금까지의 보안 기법에서는 이를 검출하지 못했지만 딥러닝은 쉽게 검출할 수 있음


딥 인스팅크트는 현재 써드파티 테스트 기관과 공동으로 딥러닝 방식의 결과를 정량화 하는 작업을 진행 중인데, 포춘500대 기업에 속한 고객사를 대상으로 한 초기 테스트 결과 기존 솔루션에 비해 멀웨어 검출율이 20~30% 높게 나타났다고 함


딥 인스팅크트는 미국의 한 대형 은행에서 10만 개의 파일에 대한 테스트를 실시했는데, 은행이 사용하던 기존 보안 솔루션은 테스트 당일 아침 최신 업데이트를 했고, 자신들의 솔루션은 마지막 업데이트가 2개월 전에 이루어진 상황


그러나 검출율은 기존 솔루션이 40%였던 반면, 딥 인스팅크트의 솔루션은 99.9%로 시시각각 생성되는 새로운 멀웨어를 거의 모두 감지한 것으로 나타남


이 대목에서 하나 재미있는 것은, 비록 딥러닝 방식이 적용되어 검출에 성공했다 하더라도, 어떻게 검출했는지 그 과정이 반드시 설명되는 것은 아니라는 점


◈ 딥러닝 시스템이 가지는 약점 중 하나가 해답에 이르는 길을 명확히 설명할 수 없다는 것이긴 하지만, 반대로 정확한 설명을 목표로 하는 제품도 있음


미국의 스타트업 뉴토니안(Nutonian)이 독자적으로 개발한 인공지능(AI) 엔진 유레카(Eureqa)는 어떤 일들이 왜 일어났는지를 찾아내는 것이 주 업무임


무슨 일이 있었는지, 그들 사이의 관계는 무엇인지에 대해 가장 간단하고 우아한 설명 방법을 찾는 것이 유레카의 목표인데, 가령 물리적 데이터를 제공하면 유레카는 뉴턴의 운동 법칙을 재발견 할 수 있다고 함


뉴토니안은 유레카 AI 엔진을 연구자에게 무상으로 제공하고 있는데, 유레카를 이용한 연구가 학술 논문에서 다루어 진 사례는 이미 500건 이상으로, 가령 의학 분야에서 노화에 따른 시력감퇴나 맹장염 등의 질병을 진단하는 새로운 모델을 찾는 데 도움을 유레카는 도움을 주고 있음


이 유레카는 사이버 보안 영역에서도 응용할 수 있는데, 가장 어려운 문제 중 하나인 사이버 공격의 구조를 분절하는 프로세스에 유레카 AI를 응용하면 이 절차를 자동으로 처리 할 수 있음


유레카는 클라우드 기반 서비스 형태로 가입 고객에게 제공되는데, 최초 데이터의 조사에만 1시간 정도 소요될 뿐 그 이후에는 매우 신속하게 답변을 얻을 수 있으며, 이전에는 몇 달 혹은 몇 년씩 시간을 들여 얻은 결과를 몇 분 만에 얻을 수 있다고 함


◈ 약간씩 수정된 변종은 딥러닝으로 자율 탐지가 가능하다 해도, 사이버 보안의 세계는 상황이 급변하기 때문에 어떤 기계학습 시스템이라도 정기적인 업데이트가 매우 중요함


사람들의 생각과 행동은 항상 이전과 전혀 다른 새로운 것으로 인해 변화해 나가는 만큼, 정기적인 업데이트 없이는 시스템이 노후화 해 버리기 때문


기업의 직원들은 새로운 일들을 시작하며, 벤더는 응용프로그램을 개편하고, 소비자는 구매 패턴을 바꾸며, 해커는 기존의 시스템을 회피하기 위해 특별히 고안된 새로운 멀웨어를 끊임없이 만들어 내고 있음


상황이 이렇다 보니 보안 벤더들은 드러난 문제들을 모두 해결한 업데이트 버전을 개발하는데 시간을 소요해야 하며, 다음 번 업데이트가 나올 때까지 시스템에 상당한 취약 기간이 발생할 수 있음


통상 해커들은 보안 소프트웨어를 구매한 다음 이를 깰 방법을 찾아낼 때까지 다양한 공격을 시도하며, 방법을 알아내면 다음 번 업데이트가 나올 때까지 해당 소프트웨어의 모든 고객들을 표적으로 공격을 할 수 있음


이런 문제를 해결하기 위한 방법의 하나로 미국의 매서지 커뮤니케이션(Masergy Communications)은 현재 대다수 보안 제품 벤더가 채택하고 있는, 모든 고객을 획일적으로 방어하는 방식에서 탈피할 것을 제안하고 있음


◈ 매서지 커뮤니케이션은 사내 패턴, 유사 기업 패턴, 산업 전체 패턴, 글로벌 패턴을 알아내는 작업을 하고, 각각 다른 주기로 업데이트 하는 방법을 제안하고 있음


매서지는 일정 수의 글로벌 요인을 이용하여 의심스러운 동작이 발생할 가능성을 탐색한 후, 이를 기업의 고유한 로컬 지표와 함께 조합함


글로벌 시스템이 살필 수 있는 입력 정보의 수에는 한계가 있고 공간이 매우 넓기 때문에 우선은 출현 빈도가 높은 특징들만 탐색함


그 다음엔 로컬에 초점을 맞추며 보다 많은 정보 입력을 받게 되는데, 로컬 모델에서는 정보들을 압축하여 보다 작은 특징의 집합으로 압축할 필요가 없으며, 이를 통해 고객별 특수성과 훨씬 높은 정확성을 얻을 수 있음


◈ 로컬 및 글로벌을 결합하는 기술은 미국의 어큐어티 솔루션(Acuity Solutions)도 이용하고 있는데, 이 회사는 기계학습을 활용하여 사이버 위협을 탐지하는 장비를 개발함


이 기업이 개발하는 블루벡터(BluVector) 시스템은 미국 정부기관의 첨단 연구 프로그램을 기반으로 하고 있으며, 다년간 개발된 우수 소프트웨어를 이용하여 잘 짜인 코드의 양상이 어떤 것인지를 학습함



<자료> Acuity Solutions.


[그림 3] 어큐어티 솔루션의 블루벡터 시스템


• 블루벡터의 엔진은 코드의 일부를 검사한 후, 잘 짜인 코드라면 보통 있어야 할 특징들이 이 코드 조각에 있는지 여부를 판정하여 알려주는 기능을 수행하며, 또한 이 과정에서 각 고객으로부터 새로운 학습을 엔진에 내재화함


어큐어티 솔루션은 고객에게 제공하기 전에 엔진을 사전에 훈련시키지만 그 이후부터 엔진은 마치 둥지를 떠난 아이처럼, 고객의 환경 속에서 학습을 계속하게 됨


주 엔진은 글로벌 데이터를 기반으로 분기 마다 업데이트가 적용되지만, 각 고객사에만 해당되는 시스템 내에서 공유되지 않음


, 이 제품은 고객의 환경에 따라 조금씩 다르게 구축되며, 개별 고객에 맞게 특수하게 맞춤화 되는 것이고, 따라서 해커가 이 제품을 구입하여 방어를 빠져 나갈 수 있는 코드를 발견하더라도 별다른 도움이 되지 않음


어큐어티 솔루션에 따르면, 이것은 이동형 방어 시스템이며, 고객의 환경에만 특화된 기술이기 때문에 리버스 엔지니어링은 불가능함


AI를 적극 수용하려는 최근의 보안 업계 움직임에 대해, 일부 전문가들은 보안 분야에서 AI는 만능이 아니라며 마케팅 차원에서 AI가 남용되는 현상에 우려를 표하기도 함


보안 전문기업 트렌드 마이크로는 보안 기술은 AI에 한정할 수 없으며, 패턴 매칭, 행동 검지, 웹 평판, 포렌식, 샌드박스 같은 대응 기술들은 보안이라는 큰 틀 내에서 모두 특기나 적용되는 맥락이 다른 것이라고 지적


또한 최근 기계학습이나 딥러닝을 응용한 보안 어플라이언스이나 클라우드 기반 보안 시스템이 잇따라 등장하는 것에 대해서도, 자체 조사결과 실행파일 형태의 멀웨어 탐지 능력은 높지만 스크립트나 매크로 형태의 멀웨어는 거의 감지 못했다고 설명


트렌드 마이크로는 최신 AI 기술을 사용하지 않은 보안 솔루션이라고 해서 안전하지 못하다고 말할 수는 없으며, 한 물 간 것으로 치부되는 기존 기술을 AI와 조합해 다층적인 방어 시스템을 구축하는 것이 필요하다고 주장


공격을 하는 것은 실제로 릴레이 서버나 멀웨어가 아니라 그 뒤에 있는 사람이고 사람은 AI보다 훨씬 지능적이기 때문에, 성숙한 기술과 새로운 기술을 결합해 몇 단계의 방어막을 통해 해커들에게 스트레스를 주고 침해 동기를 없애는 것이 중요하다는 것


◈ 그러나 향상된 AI 기술이 보안 기술에 적용됨에 따라 사이버 보안 시스템이 보다 신속하고 유연한 대응이 가능해지게 될 것이라는 점에는 대부분의 전문가들이 동의


알파고를 통해 널리 알려진 딥러닝 기술 즉, 수 많은 패턴을 학습한 후 스스로 규칙을 생성해 주어진 태스크를 처리하는 능력은 보안 분야에도 적용되어 기존의 방식보다 더 나은 성과를 낼 수 있음이 확인되고 있다는 것


지금까지 사이버 보안이 새로운 형태의 창이 등장하면 그것을 막기 위해 방패를 수정하는 수동적 방식이었다면, AI의 적용을 통해 확률 높은 임기응변적 대응과 나아가 새로운 창의 형태를 예측할 수 있는 선제적 방식으로 변화할 가능성도 보이고 있음


보안 기술의 접근성 측면에서도, 향상된 클라우드에 AI 기술이 탑재되면서 모바일 네트워크에 접속된 모든 기기에서 최신의 보안 기술을 동시에 이용할 수 있는 환경이 구축되고 있다는 것은 큰 발전으로 볼 수 있음


이런 점을 긍정적으로 보아 벤처캐피털들은 2017년 사이버 보안 시장은 인공지능(AI)이 지배하게 될 것이란 전망을 내놓고 있음


◈ 반면 보안 시스템에서 AI의 활용이 점차 늘어가는 상황은 향후 사이버 보안 분야에서도 AI가 인간을 대체할 가능성이 있음을 시사한다는 점은 곱씹어볼 필요가 있음


지금까지 사이버 보안은 프로그래밍이 탁월한 사람과 사람 사이의 경쟁이라는 인식이 강했으나, 점차 방어에서 인공지능의 역할이 늘어나게 될 가능성이 엿보이고 있음


물론 현 단계에서 인간과 AI의 해킹 공격과 방어 실력은 큰 차이가 나기 때문에 동등한 수준에서 논의할 수는 없지만, 알파고의 사례에서 보듯 아직 멀었다고 느낀 거리가 어느 시점에 좁혀질 지는 예측하기 어려움


기술 발전에 따른 인간 노동의 대체 효과가 기술이 단순 노동을 대신할 때보다 사람의 지식과 경험이 녹아 있는 일을 대신할 때 극대화된다는 점을 감안하면, 장기적으로 사이버 보안 본야 역시 AI의 역할이 커질 것으로 예상해 볼 수 있음


또한 IoT의 본격화에 따라 침해 대응을 해야 할 기기의 수가 기하급수적으로 늘어날 것이고, 해킹에 의한 피해 규모를 가늠할 수 없는 위험사회에 접어들고 있다는 점을 고려하면, 사람에 의한 대응 보다는 AI에 의한 대응이 보다 더 적합할 수도 있을 것임

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1775호(2016. 12. 7 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

트럼프시대 AI 실업대책 기본소득 논의.pdf



[ 요 약 ]


미국 대선에서 트럼프가 승리할 수 있었던 것은 지나친 빈부 격차에 불만을 가진 노동자 계층의 지지 때문으로 분석됨. 트럼프는 빈부 격차 해소를 위해 미국으로 일자리를 되돌리고 임금을 인상하겠다는 공약을 내세운 바 있으며, 선거 결과를 받아 든 실리콘밸리는 보편적 기본 소득의 필요성을 언급하기 시작. 트럼프 시대에는 AI에 의한 대량 실업의 공포와 현실화되며 기본 생활 유지비 지급으로 지나친 빈부 격차를 조금이나마 완화하려는 논의가 본격화될 전망



[ 본 문 ]


◈ 미국 대선 결과 발표 직후 트럼프 당선에 거부 의사를 표출하는 집회가 미 전역에서 열렸으며, 특히 캘리포니아 주에서는 연방에서 독립을 주장하는 목소리도 나오고 있음


 #NotMyPresident라는 트위터 해시태그에서 집회가 기획되고 있으며, 뉴욕과 로스앤젤레스를 중심으로 대규모 항의 집회가 계속되고 있음


<자료> YesCalifornia.org


[그림 1] 캘렉시트 청원 사이트


• 실리콘밸리가 소재한 샌프란시스코에서도 항의 집회가 열렸으며, 더 나아가 트럼프의 당선에 대한 반대 표시로 캘리포니아 주의 독립 운동 목소리도 강하게 비어져 나오고 있음


영국이 유럽연합(EU)에서 탈퇴한 것을 이르는 브렉시트(Brexit)에 빗대어 캘렉시트(Calexit)라 부르는 이 분리 독립 주장은 캘리포니아 주를 스코틀랜드의 입장으로 치환하고 트럼프가 국정을 맡게 될 미국에서 독립하는 것을 목표로 함


◈ 그러나 실리콘밸리 유명 인사 중 이번 대선에서 유일하게 트럼프를 지지한 페이팔의 공동 설립자 피터 틸은 실리콘밸리가 미국 사회와 크게 괴리되어 있다는 점을 문제로 지적


피터 틸에 따르면 실리콘밸리에서 혁신을 통해 태어난 비즈니스들이 번성하고 있기는 하지만, 이런 성공은 개인의 자산을 늘리는 결과만 가져오고 있을 뿐, 미국 보통 시민들의 생활을 나아지게 하는데 기여하는 것과는 거리가 멂


틸은 미국의 가구당 소득은 오랫동안 침체인 반면 의료비는 세계에서 가장 높은 수준이고, 학생들은 거액의 학비 대출을 안고 있어 취직을 해도 상환에 쫓기는 상황에서 실리콘밸리는 사회 현상을 이해하고 기업의 사회적 책무를 다해야 한다고 주장함


실제로 대선 결과는 실리콘밸리가 미국 사회와 얼마나 괴리되어 있는 지를 말해 주며, 실리콘밸리뿐 아니라 미디어를 포함한 미국의 기득권층이 보통 시민들의 정서를 전혀 읽지 못하고 있었음을 보여 준다는 분석도 나오고 있음


오바마 정부는 리먼 쇼크에서 회복했다고 주장했지만, 혜택을 받은 것은 기득권층으로 블루 칼라들의 상대적 박탈감은 더욱 커졌고, 많은 사람들이 현 정치 체제에 큰 불만을 품게 만든 원인이 되었다는 것


힐러리의 패배는 지나친 사회 격차에 기인한다고 해도 과언이 아니며, 투표 결과에는 겉으로 목소리를 높이지 않았던 다수 시민의 의견이 반영된 것이라는 평가


◈ 승리 요인이 무엇이었든 간에 이제 대통령에 당선된 트럼프는 자신을 지지해 준 시민들의 목소리에 부응해 선거 기간 동안 제시한 공약을 지켜야 할 책임을 지게 되었음


<자료> Donald J. Trump for President, Inc.


[그림 2] 트럼프의 고임금 공약


• 트럼프 당선자는 빈부 격차를 해소하기 위한 방안의 하나로 외국으로 나간 자국 기업들에게 일자리를 미국으로 불러 들이게 할 것과 임금 인상을 약속한 바 있음


대표적으로 트럼프는 애플에 각을 세우며, 선거 기간 내내 미국 내에서 아이폰을 생산할 것을 강력히 요구한 바 있음


애플을 비롯한 주요 IT 업체들이 미국으로 유턴을 재촉하는 트럼프와 조율을 하는 데에는 현실적으로 한계가 있을 수밖에 없을 것이란 전망이지만, 애플이 폭스콘에 미국 이전 의사를 타진했다는 뉴스가 나오는 등 실현 가능성이 아주 없는 것은 아님


◈ 그러나 미국 기업들이 트럼프에 호응해 설사 미국으로 제조 기반을 옮긴다 하더라도 또 다른 문제가 불거질 가능성이 있는데, 제조업 현장이 이미 자동화로 급변하고 있기 때문


트럼프는 미국 내 제조업 일자리를 늘린다고 약속했지만, 제조업을 포함한 전 산업이 점차 인공지능(AI)과 로봇에 의해 대체되어 갈 것이라는 게 전문가들의 공통 전망이므로, 제조업 유턴 조치가 곧 바로 고용 증가와 임금 인상으로 이어질 지는 미지수임


트럼프가 집권할 향후 4년은 AI와 자율운전 자동차를 포함한 로보틱스로 인한 실업 문제가 본격화될 것으로 보이며, 따라서 멕시코 이민자가 아니라 기술이 일자리를 위협하게 되는 상황이 벌어질 가능성이 농후하기 때문


이는 트럼프 정부가 실리콘밸리의 위상을 어떻게 자리매김 할 것인지, AI를 포함한 실리콘밸리의 혁신이 계속 추진될 수 있을 것인지 하는 문제와도 맞닿아 있음


실업을 낳을 수 있는 AI와 로봇의 개발을 억제할 것인지, 아니면 미국을 다시 강하게 만든다는 트럼프의 슬로건 구현을 위해 기술 분야에서 혁신이 필수적이라고 판단할 것인지, 향후 트럼프의 구상에 관심이 모이는 이유임


◈ 이런 배경에서, 의외의 선거 결과를 받아 든 실리콘밸리에서는 보편적 기본소득(Universal Basic Income)에 관한 논의를 수면 위로 올리려는 움직임이 보이고 있음


보편적 기본소득 AI와 로봇의 진화로 많은 사람들이 일자리를 잃을 것으로 우려됨에 따라 실업 대책의 하나로 소득을 일부 보전할 수 있는 현금을 지급함으로써, 지나친 빈부 격차를 해소하려는 시도임


<자료> Marc van der Chijs.


[그림 3] 보편적 기본소득


• 기본소득은 사회 보장의 일종으로, 시민들은 정기적으로 일정액의 수당을 정부나 공공 기관으로부터 수령하며, 시민은 기본소득을 통해 최소한의 생활을 유지할 수 있음


기본소득 앞에 보편적 혹은 조건 없는(Unconditional)이라는 수식어가 붙은 것은 기본소득이 빈곤층뿐만 아니라 국민 모두에게 보조금 성격으로 지급되는 것이기 때문


보편적 기본소득을 도입하면 주택 보조, 식량 지원, 노인 의료 등 여럿으로 나뉜 복지 시책을 없애고 기본소득으로 일원화하여 운용할 수 있기 때문에, 정부 입장에서는 복지 운영 조직을 단순화하고 운영 비용을 낮춘다는 장점도 있음


반면 기본소득을 도입하기 위해서는 대규모 재원이 필요하다는 것이 최대 장벽이며, 또한 국민에게 최소한의 생활비를 지급하면 근로 의욕을 없애 도덕적 해이를 조장하는 부작용이 나타날 것이라는 뿌리 깊은 우려도 있음


논란의 여지가 많아 보편적 기본소득 논의는 쉽지 않았으나, 트럼프 당선자로 인해 사회 빈부 격차의 심각성이 명확하게 표면화된 만큼 기본소득에 관한 논의가 이전보다 본격화될 수 있는 조건은 마련되고 있음


AI 연구를 주도하는 유명 인사들은 대체로 기본소득의 필요성을 호소하고 있는데, 바이두(Baidu)의 인공지능 연구소장 앤드류 응과 테슬라의 창업자 일론 머스크가 대표적


<자료> Andrew Ng @ Twitter.


[그림 4] 앤드류 응의 기본소득 주장


• 선거 결과 발표 직후 응 소장은 블로그를 통해, 선거 결과는 불공평에 대한 불만을 반영하고 있다며, 시민들의 생활이 어느 수준 이하로 내려가지 않도록 보장하기 위해 기본소득이 필요하다고 주장


아울러 모든 사람이 사회적 계단을 올라 서게 하기 위해서는 더 나은 교육을 제공할 필요가 있다며, 대통령 선거에서 드러난 격차 문제를 해결하기 위한 방안들을 제시


테슬라의 창업자 일론 머스크 역시 기본소득이 필요할 것이라는 견해를 보이고 있는데, 이는 테슬라가 완전 자율운전 자동차 개발을 목표로 하고 있으며, 테슬라의 제조 공장에서 로봇에 의한 자동화가 진행되고 있다는 사실과 무관하지 않아 보임


, 머스크의 계획이 실현되면, 직업 운전수와 공장 노동자는 자율운전 차량이나 로봇으로 대체되어 일자리를 잃을 가능성이 높아지는데, 이에 따른 문제 해결 방식의 하나로 기본소득을 고려하고 있는 것으로 추측이 가능


◈ 진화한 AI 기술 개발 경쟁이 치열한 실리콘밸리에서는 기술이 가져올 사회적 영향에 대한 논의도 활발하며, 이미 기본소득의 실증 실험이 진행되고 있기도 함


실리콘밸리를 대표하는 액셀러레이터인 Y 콤비네이터(Y Combinator)CEO 샘 알트만은 올해 5월 기본소득의 시험 운용을 시작한다고 발표하였음


사회 실험은 샌프란시스코 건너편 오클랜드에서 시작되었는데, 이 지역에서 100 가족을 선정, 매월 1,000~2,000 달러 정도의 현금을 지급하며, 기간은 6개월에서 1년 사이로 수급자는 받은 돈을 자유롭게 사용할 수 있음


오클랜드를 선정한 이유는 빈부격차가 뚜렷한 도시이기 때문이며, 아울러 오클랜드에서는 하이테크 기업들이 들어서며 지역 주민과 관계가 악화되고 있기 때문


부유한 하이테크 기업의 직원들이 이주해 오며 물가와 집세가 급등함에 따라, 원래 살던 주민들은 교외에 밀려나게 되는 것을 고급 주택화(젠트리피케이션, Gentrification) 라고 하는데, 오클랜드 역시 이 문제를 심각하게 겪고 있음


<자료> Quartz.


[그림 5] Y 콤비네이터의 기본소득 실험


Y 콤비네이터는 밀려난 빈곤층 주민들에게 기본소득을 제공함으로써 갈등을 완화할 수 있는지 검증을 진행하고 있으며, 이 실증 실험의 결과가 긍정적으로 나온다면 본격적인 프로그램으로 이행할 계획이라고 함


기본소득의 실증 실험은 오클랜드 프로젝트가 처음은 아니며, 이미 네덜란드의 위트레흐트, 캐나다의 도핀, 아프리카 나미비아 일부 지역 등에서 제한적인 기본소득 제도를 도입한 적은 있음


핀란드는 내년부터 모든 국민에게 조건 없이 매달 560 유로( 70만원)의 기본소득을 지급하는 정책을 시험 운영할 계획이며, 스코틀랜드도 지난 달에 기본소득 시범사업을 실시한 이후 정식 시행 여부를 결정하겠다는 계획을 발표하였음


그러나 이들 국가는 모두 정부 차원에서 실험이 진행되는 것으로, Y 콤비네이터는 기본소득이라는 사회보장 정책을 민간기업이 맡겠다고 나섰다는 점에서 의미가 있음


◈ 왜 민간기업이 이런 실험을 하는 지, Y 콤비네이터는 명확한 답변을 하고 있지 않으나, 기본소득이 기술 기업의 새로운 사회적 책무가 될 가능성을 염두에 둔 것으로 보임


Y 콤비네이터는 실험 배경에 대한 명확한 설명 없이, 기본소득이 현재 시행되고 있는 실업 보험 등 사회 안전망의 대안이 될 수 있을 것이란 언급만 하고 있음


기술 발전으로 노동자들이 일자리를 잃게 되면 수입이 없어 생활이 막히게 되므로, 그러한 원인을 만들어 낸 기업이 사회적 책무를 다해야 하지 않느냐는 생각을 갖게 된 것으로 보이며, 그 수단의 하나로 기본소득에 관심을 쏟는 것으로 보임


지금까지 IT에 의한 자동화로 많은 일자리가 컴퓨터로 대체되었으나 AI에 의한 자동화는 지금까지와 비교할 수 없을 정도로 사회에 미치는 영향이 클 것으로 전망


Y 콤비네이터의 실증 실험은 AI와 로봇, 자율운전 자동차를 개발하는 기술 기업은 앞으로 사회 공헌의 방식을 재검토해야 할 수도 있음을 시사하고 있음


◈ 기술에 의한 인간 노동의 대체 흐름이 전 산업에서 세계적 규모로 발생한다면, 이는 곧 사회의 근간이 흔들리는 일이며, 결국 기업도 자신들이 위험해질 수 있음을 인지해야 함


기술 혁신과 인력 감축으로 기업은 높은 수익을 창출할 수 있지만, 이익을 재분배하는 메커니즘이 없다면 소득의 격차는 지금보다 더 벌어질 것임


그런 상태가 지속된다면 사회와 경제가 불안정해지고 일상을 위협하는 위험요인들도 증가하게 되는데, 이런 상황을 방지하기 위해서 기업들은 기술 개발을 진행하는 동시에 사회적 책임도 다해야 함을 인정할 필요가 있음


기본소득을 도입하면 일을 하지 않아도 최소한의 생활이 보장되기 때문에 사회의 안정성을 그 만큼 유지할 수 있고, 이는 기업으로서도 자신들의 재화와 서비스를 구매해 줄 소비자를 확보하게 된다는 면에서 의미 있는 일이 될 것임


◈ 물론 일을 하지 않아도 기본소득을 지급하는 것에 대해서는 여러 반론들이 있으며, 오래된 반대 논리는 기본소득이 사람을 나태하게 만들 것이란 우려임


일을 하지 않고도 생활 유지가 가능하다면 사람들은 자신의 존재 의의를 스스로 추궁하거나 혹은 사회적으로 추궁 당하게 된다는 것임


사람은 생활 유지를 위해 싫은 일이라도 억지로 하지만, 동시에 일을 통해 자신의 가치를 증명하고 존재 의의를 확인하려 하기 때문에, 일을 하지 않고 생활이 가능하다면 자신의 가치를 잃어 버리는 문제가 생길 수 있다는 지적


이런 반론에 대해서는, 하기 싫은 일에서 해방되면 사람이 창조성을 발휘할 수 있으며, 기본소득으로 최소한의 생활을 할 수 있다면 사람들이 관심을 가진 분야에 자유롭게 뛰어들 수 있다는 재반론도 있음


기본소득으로 그림 그리기를 좋아하는 사람은 시간에 구애 받지 않고 그림에, 프로그래밍을 좋아하는 사람은 자유롭게 해킹에 몰두할 수 있게 된다는 것


기본소득이 도입되지 않은 지금도 창의성은 개인의 자유로운 활동에서 나오고 있는데, 만일 기본 생활까지 보장된다면 더 많은 창의성이 분출될 가능성도 있음


AI로 인한 대량실업 시대 다음은 AI가 인류를 먹여 살리는 시대가 될 것이란 전망도 있는데, 이 때 기본소득은 다음 AI 시대로 부드럽게 넘어가는 완충재 역할을 하게 됨


AI가 인류를 능가하는 시작하는 지점인 특이점(Singularity)의 도래를 주장하는 구글의 인공지능 연구 책임자 레이 커즈와일은 AI와 로봇에 의한 자동 기술의 발전으로 인류의 생활을 지탱할 생산이 가능해져 사람이 일할 필요가 없어진다고 전망하고 있음


그렇게 되면 사람들은 오히려 을 계속 하겠다고 주장하고 될 것인데, 여기서 일이란 누군가 명령해서 해내는 작업이 아니라 스스로 열심히 하고 싶어 하는 일을 의미하며, 인간이 보람을 느끼지 못하는 노동에서 해방됨을 의미함


커즈와일은 전세계적으로 사람들이 하고 싶은 일을 하게 되면 인류의 창조성에 폭발이 일어날 수 있다고 예언하며, 발달된 AI 사회에서는 전 지구적 규모로 창조성이 개화하며 새로운 문명이 태어날 것이라 낙관하고 있음


이런 장밋빛 예측에 대해 반대 의견도 적지 않지만, 기본소득이 AI의 진화와 함께 논의되는 것은 기술에 낙오된 인간을 보호한다는 소극적 차원이 아니라, 인간의 창의성을 발현하기 위한 적극적인 맥락도 있다는 점을 이해할 필요가 있음


◈ 공화당은 기술기업과는 전혀 반대의 관점에서 기본소득에 찬성하는 것이긴 하지만, 여하튼 기술 기업들과 트럼프는 기본소득에 관한 논의를 확산시켜 나갈 것으로 전망


트럼프 승리와 함께 상원과 하원 선거에서도 모두 승리한 공화당은 기본소득 정책에 기본적으로 친화성이 높음


물론 공화당은 여러 갈래로 나뉜 복지 예산을 기본소득 하나로 묶되 총합의 규모는 줄이자는 것으로, 작은 정부를 구현하기 위한 전략의 하나로 기본소득을 보고 있음


공화당은 그 동안 오바마 정부가 운영해온 사회보장 제도에 지속적으로 반대 의사를 표시해 왔으며, 일례로 식량 지원을 받고 있는 사람의 수의 오바마 정부에서 급증한 것에 대해 강력하게 비판한 바 있음


그러나 트럼프는 대선 과정에서 임금 수준의 향상을 약속했고 그에 힘입어 당선이 되었으므로, 전통적인 공화당의 노선을 그대로 따를 수는 없는 상황에 놓여 있음


AI와 로보틱스 기술은 아이러니하게도 향후 트럼프 집권 기간 크게 개선될 전망이며, 트럼프의 바람과는 반대로 대량 실업 시대에 돌입하게 되는 원인이 될 수 있음


그런 상황에 대해 트럼프가 어떤 입장에 서게 될 지는 일반 국민과 기술 기업 모두에게 매우 중요할 것이며, 트럼프 정부와 기술 기업이 양대 축으로서 기본소득에 대한 미국의 전국민적 논의 확산을 이끌 가능성이 높아지고 있음

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1771호(2016. 11. 09 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

독일 IBM 왓슨 IoT 사업부 제조업4.0.pdf



[ 요 약 ]


105년 역사의 글로벌 기업 IBM은 주요 연구소와 사무소를 미국 밖에 두고 있지만 사업본부만큼은 계속 미국에 두어 왔음그러나 이런 전통은 2015 12월 IBM 왓슨 사물인터넷 사업본부의 글로벌 헤드쿼터를 독일 뮌헨에 설치하면서 깨졌고, 10개월 여가 지난 지금 IBM은 뮌헨의 사업본부에 2억 달러를 추가 투자하기로 결정하였음. IBM의 행보는 제조업 4.0의 글로벌 선두인 독일의 환경과 왓슨 IoT 플랫폼을 결합해 기업 AI 시장을 주도하기 위한 것으로 보임




[ 본 문 ]


IBM은 지난 10 4일 독일 뮌헨의 왓슨 사물인터넷(Watson IoT) 사업 본부 2억 달러를 투자할 것이라 발표했는데, 이는 IBM의 유럽 내 투자로는 사상 최대 규모임


IBM은 왓슨 인지 컴퓨팅(cognitive computing) IoT에 접목하기 위해 총 30억 달러 규모의 글로벌 투자 계획을 밝히고 있는데, 이번 2억 달러의 투자는 그 일환임.


IBM에 따르면 이번 투자는 IoT와 인공지능(AI) 기술을 결합해 현재 사업을 변혁할 것을 모색하고 있는 고객들의 수요가 높아지고 있는 상황에 대응하기 위한 것임



<자료> IBM.

[그림 1] 뮌헨의 왓슨 IoT 사업본부


IoT가 이만큼 커진 이상 초점을 맞추지 않을 수 없게 되었으며, 지난해 특히 IoT에 전문성을 가진 사업부문으로 첫걸음을 내디뎠는데, 이 선택이 좋은 시작이었다고 IBM은 자평


현재 IBM은 무게중심을 조금 바꾸고 있는데, 글로벌 초점을 갖는 것이 중요하다고 생각하고 있으며, 작년 12105년 기업 역사상 처음으로 IBM의 글로벌 헤드쿼터를 미국 밖인 독일 뮌헨에 설치하였음


독일에 글로벌 헤드쿼터를 설치한 것은 일단 수치 상으로는 성공적으로 보이는데, 왓슨 IoT 솔루션과 서비스를 이용하고 있는 고객의 수는 8개월 전에 전세계적으로 4,000개였지만 현재는 6,000개로 급격히 증가하고 있음


IBM은 이번 2억 달러 투자로 왓슨 IoT 글로벌 헤드쿼터가 최초의 인지적 IoT 가상 네트워크 연구소 집단(Collaboratory, 콜래보러토리)이 될 것이라 설명하고 있음


가상 네트워크 연구소 집단은 각기 다른 지역에 위치하고 있지만 공동 프로젝트를 위해 네트워크로 연결된 연구소 집단을 의미하는 신조어임



<자료> Collaboratory Gothenburg.


[그림 2] 콜래보러토리 마인드 맵


IBM의 설명은 뮌헨의 헤드쿼터가 전세계 IBM의 고객과 파트너들이 IBM의 연구원, 엔지니어, 개발자, 비즈니스 전문가들이 함께 모이는 산업 연구소로 기능하게 될 것이라는 의미


가상의 네트워크 연구소 집단은 자동차, 전자, 제조, 헬스케어, 보험 산업 등에서 혁신을 촉진한다는 목표 아래 활동을 전개해 나가게 될 것이라고 함


◈ 왓슨 사물인터넷 사업본부의 브렛 그린슈타인 부사장은 독일을 선택한 이유에 대해 제조와 공업 분야 글로벌 리더인 독일은 IBM의 정책 추진에 있어 완벽한 파트너라 설명


IBM은 보도자료를 통해 전세계 기업들이 엄청난 기술 변혁 시기의 혜택을 입고, 사람들의 일상을 변화시킬 수 있는 새로운 제품과 서비스를 개발할 수 있도록 IBM은 광폭 행보를 해나갈 것이라 밝히고 있음


독일은 제조업 4.0(Industry 4.0) 흐름의 최선두에 서 있기 때문에, IBM은 자신들의 고객과 파트너들을 뮌헨으로 불러 모으고, IBM의 기술을 그들에게 개방함으로써 IoT 비전의 구현을 지원함으로써, 협업적 혁신(collaborative innovation)을 위한 글로벌 거점을 설립하려 한다는 것임


IBM IoT 사업 전개를 위한 노력을 독일에 집중시키려는 것을 잘 보여주는 고객 기업 중 하나가 독일 에닝겐에 있는 자동차 및 제조 산업의 공급업체인 셰플러(Schaeffler)



<자료> Manufacturers' Monthly.


[그림 3] 셰플러와 IBM의 제휴


• 셰플러는 올해 10 4 IBM과 다년간의 제휴를 맺는다고 발표했는데, 왓슨과 IoT를 사용하여 사업 전체와 고객 솔루션의 디지털 혁신을 추진하는 것이 제휴의 목적임


셰플러는 이제 제조업체들은 부품 스스로 성능을 모니터링하고 평가하며, 필요할 경우 대체 부품을 요구하는 시대에 접어들고 있으며, 자신들의 목표는 인지적 솔루션을 보유한 글로벌 선도 제조업체가 되는 것이라 밝히고 있음


셰플러는 제품의 개발과 제조에서 세계 선도업체이고, IBM은 하이브리드 클라우드와 인지 컴퓨팅의 글로벌 리더이기 때문에, 양사의 제휴를 통해 셰플러는 새로운 공업시대의 막을 열고자 한다는 것


셰플러는 기계용 정밀 부품 전문 기업으로 자동차 클러치 시스템부터 풍력 터빈에 사용되는 산업용 베어링까지 다양한 부품을 생산하고 있는데, 왓슨 IoT를 활용하여 전체 공업 시스템을 표현하는 가상 모델을 구축한다는 계획을 가지고 있음


이 가상 모델은 운영 과정 전반에 걸쳐 수백만 개의 센서와 기기에서 수집한 데이터들을 제공받게 되며, 이를 통해 제품 설계, 제조 및A/S에 대한 새로운 접근 방식을 가능케 할 것으로 기대되고 있음



◈ 뮌헨 북서쪽 네덜란드에 위치한 산업용 무인 항공기 시스템의 설계 및 개발 전문업체 에어리얼트로닉스(Aerialtronics)도 왓슨 IoT 고객 기업 중 하나임



<자료> Aerialtronics.


[그림 4] 왓슨 IoT 결합 드론


이 기업사의 드론은 IBM의 클라우드에서 실행되는 왓슨 IoT 플랫폼의 인지 컴퓨팅 기능을 이용한 검사 서비스를 제공하고 있는데, 도시의 교통 패턴 파악에서부터 풍력 터빈, 석유 시추 장비, 휴대폰 기지국 최적화 검사까지 다양한 용도로 사용할 수 있음


드론은 왓슨 비주얼 인식(Watson Visual Recognition)이라는 분석 도구를 통해 목표 대상물이 어떻게 보이는지를 이해할 수 있는데, 가령 통신 관련 시설이라면 배선의 풀림이나 열화 장비의 손상 등 통신 품질에 영향을 줄 수 있는 상황을 파악할 수 있음


에어리얼트로닉스는 드론의 탁월한 조감 능력과 검증된 왓슨 IoT 솔루션의 처리 능력을 결합해 어느 곳에서든 모든 것에 관해 행동에 반영 할 수 있는 통찰력을 얻을 수 있었으며, 이 지식을 통해 비즈니스의 중요한 의사 결정을 지원할 수 있었다고 설명


◈ 무게중심을 유럽에 두고 있지만, 왓슨IoT 사업부문은 여전히 자신들의 뒤뜰인 미국에서 사업을 따내고 있는데, 대표적 예가 토마스 제퍼슨 대학병원


필라델피아 주에 자리한 957 병상의 응급 처치 시설을 갖춘 이 병원은 제퍼슨 헬스(Jefferson Health) 소속이며, IBM은 이 대학병원과 협력하여 왓슨 IoT를 기반으로 하는 인지적 기능을 갖춘 병실 개설 사업을 진행하고 있음



• 병실의 환자들은 왓슨 IoT 플랫폼과 연결되어 있는 실내 스피커에 말을 건넴으로써, 실내 조명과 창문 블라인드를 제어할 수 있고, 또한 병원 시설에 대해 질문하거나 자신들의 담당 의사에 대한 배경 정보를 얻을 수 있음



<자료> Gizmag.


[그림 5] 왓슨 기반 병실 스피커


소비자들은 이미 애플 시리(Siri)나 아마존 에코(Echo) 스피커, MS의 코타나(Cortana) 등을 통해 음성 인식"라는 서비스를 통해 초보적인 음성 인식을 경험하고 있음


IBM 측은 이들 서비스가 미리 정해진 명령어를 처리하는 수준이라면, 왓슨 IoT 기반의 인지 병실에서는 복잡한 문장의 해석이 가능하다며 차별성을 설명하고 있음


간단한 회화도 가능한데, 가령 환자는 스피커에 온도를 물어보고 그 대답을 듣고 나서, 너무 더우니 온도를 좀 낮추라 등의 지시를 내리는 것도 가능하다고 함


◈ 이처럼 산업 특화 서비스에 초점을 맞춘 IBM의 최근 행보는 기업 시장의 터줏대감답게 산업용 인공지능 시장의 주도권을 선점하기 위한 것으로 볼 수 있음


최근 기술의 소비재화(consumerization)가 급격히 진전됨에 따라, 소비자 시장에서 검증된 기술과 서비스를 기업 환경에 적용하거나, 아예 기업 환경에서 그대로 사용하게 하는 흐름이 나타나고 있음


스마트폰 및 관련 서비스 시장이 점차 포화 상태에 이르면서, 애플과 구글 등은 법인 시장으로 확장을 도모하기 위해 기존 법인 시장 플레이어들과 제휴도 늘려가고 있음


이런 흐름에 대응하기 위해 IBM은 인지 컴퓨팅 왓슨 기술의 산업 현장 적용을 위해 과감한 투자를 해오고 있는데, IBM의 발 빠른 행보는 경쟁기업들 역시 대응 속도를 높일 수밖에 없도록 추동하는 효과를 가져올 것임


인공지능 기반 서비스들이 하나 둘씩 선보이기 시작한 가운데, 기업 부분 인공지능 시장의 주도권을 차지하려는 IBM, 법인시장의 강자인 MS는 물론 법인 시장 진출을 모색하고 있는 애플, 구글의 경쟁 역시 치열한 경쟁을 시작할 것으로 보임


◈ 한편 IBM은 왓슨 IoT 글로벌 사업본부에 2억 달러 투자를 발표하는 자리에서, 블록체인, 보안 솔루션, 자연어 인터페이스 등 새로운 기능과 서비스에 대한 발표도 병행


IBM은 왓슨 IoT 플랫폼을 통해 IoT의 데이터를 블록체인과 연결하는 새로운 기능을 제공하는데, 이로써 기업들은 사람과 제품이 복잡하게 얽힌 네트워크 상에서 비즈니스를 수행하는 데 따르는 비용과 복잡성을 줄이며, 안전하고 사전인 블록체인 안에서 IoT 데이터를 공유할 수 있게 되었다고 설명


이 기능은 IBM 블록체인에 완전히 통합되어 있는데, 핀란드 기업 키노(Kinno)는 왓슨 IoT 플랫폼을 이용하여 기기들을 블록체인에 연결하고 있음


키노는 이 기술을 이용하여 컨테이너의 상태와 위치에 대해 추적, 모니터, 보고할 수 있는 솔루션과, 선박 항로를 따라 수하물의 포장과 운송을 최적화 할 수 있는 솔루션을 개발하고 있음


IBM은 또한 왓슨 IoT 플랫폼을 통해 강화된 새로운 IoT 보안 솔루션 및 서비스를 사용하여 기업이 잠재적인 위험을 미연에 파악하고 기기에 대한 보안 침해를 방지 할 수 있는 기능을 제공하려고 함


새로운 보안 기능은 네트워크 전체에 걸쳐 잠재적인 취약점을 시각화하거나 즉시 경고를 통지할 수 있으며, 각 기업 고객의 개별 환경에 맞게 운용을 자동화할 수 있음


또한 변칙적 상황을 식별하는 위협 정보분석, 그리고 데이터 활용도를 극대화하면서 데이터 프라이버시를 보호할 수 있는 데이터 익명화 기능도 포함하고 있음


왓슨 IoT 플랫폼을 이용해 집, 자동차, 상점, 호텔, 사무실에서 사용할 수 있는 새로운 음성 인터페이스를 개발할 수 있는 방법도 지원하고 있음


미국의 로컬 모터스(Local Motors)는 자연어로 승객과 상호작용하는 자율운전 차량 올리('Olli)를 개발 중인데 여기에 왓슨 기반의 자연어 인터페이스를 도입하고 있음


인지 IoT 조리법(CookBook)은 개발자를 위한 새로운 가이드 북으로 왓슨의 자연어 API를 이용해 인지 IoT의 도전과제를 해결하기 위한 코드와 모범 사례를 포함하고 있음


새로운 기능과 서비스들은 특히 보안에 초점을 두고 있는데, 이는 보안에 민감한 법인시장을 겨냥한 것으로 볼 수 있으며, 왓슨 IoT를 기업용 인공지능 시장에 빠르게 확산시키기 위한 노력의 일환이라 할 수 있음

※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1768호(2016. 10. 19 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

세계 최초 탁구 코치 로봇 포르세우스.pdf



◈ 산업용 컨트롤러 개발 전문업체 오므론(Omron)이 개발한 세계 최초의 탁구 코치 로봇이 기네스 측으로부터 세계 최초 기록 인증서를 수여 받았음


오므론은 일본 최대 선진기술 종합전시회인 시텍 재팬(CEATEC JAPAN) 2014년부터 탁구 코치 로봇을 선보이고 있는데, 이달 초 열린 시텍 재팬 2016에는 인공지능(AI)을 탑재한 3세대 모델 포르페우스(Forpheus)를 전시하였음


포르페우스는 올해 1월 세계 최초의 탁구 코치 로봇으로 기네스 세계 기록을 인정받았으며, 이번 시텍 재팬 행사에서 정식으로 기네스 월드 레코드 증서를 받았음


◈ 포르페우스 로봇은 기본적으로 산업용 로봇 센서와 제어 컨트롤러, 병렬 컴퓨터를 사용하며, 여기에 100명 이상 탁구 선수의 플레이 데이터를 학습한 AI를 탑재한 것이 특징



[동영상탁구 코치 로봇 포르페우스


구조를 보면 로봇 상단의 카메라 2 대가 공이 오는 코스와 속도를 초당 80회 측정하여 볼의 낙하 지점을 예측한 후 리턴을 하도록 설계되어 있음



 AI3회 정도 랠리를 하면서 플레이어의 표정, 신체의 움직임, 볼의 궤도 등을 분석한 후, 플레이어의 레벨을 3단계로 구분해 초보자의 경우는 리턴하기 쉬운 지점에, 상급자의 경우 리턴이 어려운 지점을 겨냥해 공을 되돌려 보낸다고 함


테이블의 네트 부근에는 가로 디스플레이를 설치해, 코너 노리기를 잘 하시네요!, 완벽한 서브네요!, 랠리가 10회 이어졌습니다 등 동기를 부여하는 이미지를 표시하며, 이런 기능을 통해 탁구 초보자들의 연습에서 가장 바람직한 긴 랠리를 구현함


탁구 코치 로봇의 센싱과 제어 기술은 공장의 조립 라인에서 일하는 사람의 컨디션이나 숙련도를 로봇이 분석하는 데서 축적한 것인데, 오므론은 이런 산업기술에 인공지능 기술을 더해 일상생활이나 사회 문제를 해결하는 비즈니스를 추구하고 있음

※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1766호(2016. 10. 05 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

구글 새 메신저 알로 발표 대화형 AI의 비즈니스 가능성.pdf



[ 요 약 ]


구글이 9 21일 인공지능(AI)을 탑재한 메시징 앱 알로(Allo)를 출시하였음알로는 현재 많은 사람들이 사용하고 있는 주류 메신저들과 달리기계학습 기반의 스마트 응답 기능과 구글 어시스턴트(Google Assistant)라는 가상의 비서 기능을 탑재하고 있는 것이 최대 특징가상 비서는 대화형 AI로 사용자와 대화는 물론 사용자 간 대화에도 참여해 도움을 주는데아직 개발 도중에 있지만 대화형 AI가 거대 비즈니스로 성장할 가능성의 단초를 보여주고 있다는 평가




[ 본 문 ]



◈ 그 동안 메신저 서비스에서 번번이 고배를 마셨던 구글이, 이번에는 알로(Allo)듀오(Duo)를 출시하며, 큰 호응을 얻고 있음


구글은 4달 전 구글 I/O 컨퍼런스에서 인공지능에 집중하겠다는 비전을 밝힌 바 있으며, 9월 초순 영상통화 앱인 듀오를 먼저 출시한 데 이어, 9 21일 메신저 앱 알로를 발표하였는데, 두 앱 모두 서비스 초기 큰 호응을 얻고 있음




<자료> Google Play.


[그림 1] 구글 알()와 구글 듀오(아래)


• 구글은 지금까지 구글 토크, 구글 챗, 행아웃 등 다양한 메신저 서비스를 내놨지만 번번이 왓츠앱이나 페이스북 메신저 밀렸는데, 알로와 듀오는 초기단계 관심 모으기에 일단 성공한 모양새


알로의 구글이 사용자들의 의사소통과 표현 방식을 학습하기 위해 인공지능을 활용한 첫 번째 메시지 앱으로, 가장 큰 특징 두 가지는 1)기계학습을 기반으로 한 스마트 응답 기능을 선보인 것과, 2)구글의 음성인식 모듈인 구글 어시스턴트(Google Assistant)를 내장한 것


스마트 응답 기능은 대화 맥락에 맞게 자동으로 여러 가지 답장 내용을 제안하는 것이며, 구글 어시스턴트(Google Assistant) 기능 탑재는 AI 기반의 가상 비서와 대화하거나 가상 비서를 사용자 간의 대화에 참여시키는 기능임


구글플레이 통계에 따르면, 9월말 현재 듀오의 다운로드 수는 1천만~5천만 건 구간에, 알로의 다운로드 수는 1백만~5백만 건 구간으로 표시되어 있음


◈ 알로는 사용자 편의성을 높이기 위해 수신 메시지나 사진의 내용을 이해한 후 자동으로 회신 문장을 생성하는 스마트 응답(Smart Reply) 기능을 갖췄음


메시지 수신 후 실시간으로 Sure, Yes, No 등의 간단한 답변 문장을 생성하여 제시하므로, 직접 입력할 필요 없이 터치만으로 회신할 수 있어 편리한데, 이 스마트 응답 기능은 이미 구글의 메일 앱인 인박스(Inbox)에 적용돼 인기를 모은 검증된 기능임



<자료> Google


[그림 2] 알로의 스마트 응답 기능


• 스마트 응답 기능은 사진 수신 시에도 사용할 수 있는데, 가령 공항에서 촬영한 비행기의 사진을 받으면 알로는 비행기 멋지네(Nice plane), 좋은 여행이 되길(Have a nice flight), 여행 잘 다녀와(Bon voyage!) 등의 응답을 자동 생성함


사진을 이해하고 응답을 생성하는 기능에는 고도의 이미지 인식 기능이 적용되어 있는데, 가령 해바라기 사진을 보고 알로가 멋진 해바라기(Nice sunflower)'라는 답변을 생성한다는 것은 객체가 꽃이라는 것뿐만 아니라 해바라기인 것까지 파악한다는 뜻


사람에게는 쉽지만 기계에는 어려운 것이 이미지 인식인데, 기계가 꽃의 종류까지 판단하려면 고도의 기술이 필요하고 배후에는 신경망이 사용되고 있음


◈ 이미지 인식이 쉽지 않다는 사실은 알로가 아직 음식 사진에 대해서는 구체적 응답을 정확히 제시 못하는 데서도 알 수 있는데, 이는 학습시간의 축적에 의해 해결되어 갈 것


• 가령 알로는 위의 해바라기 경우와 달리 샐러드 사진에 대해서는 맛있겠다(Yummy!)먹어보고 싶다(Wish I could try) 정도의 응답 문장만을 생성하는데이는 알로가 음식이라는 것은 이해하지만 요리의 종류까지는 특정할 수 없음을 반증함



<자료> Google


[그림 3] 꽃 종류 구분 가능, 음식 종류 구분 불가


그러나 구글은 이미지 인식 기술에서 세계 최고 수준의 기술을 보유하고 있으며, 요리의 종류를 인식하는 것이 매우 어려운 것은 아니므로 조만간 음식 구분 기능도 알로에 구현될 것으로 보임


알로는 기계학습을 거듭함으로써 이용자의 표현 방법을 배워 가므로, 데이터가 쌓일수록 이용자의 스타일을 반영한 응답 문장을 만들어 제시할 수 있게 될 것임


◈ 메신저 시장에서 승리하기 위해서는 아무래도 젊은층의 관심을 끌 필요가 있는데, 기존 구글의 제품들과 달리 알로는 표현력이 풍부하고 메시지를 그래피컬하게 보여주고 있음


가령 속삭이기 또는 외치기(Whisper or Shout) 기능은 메시지를 입력한 후 보내기 버튼을 누른 상태에서 슬라이드를 따라 위아래로 움직이며 텍스트의 크기를 변경시킬 수 있는데, 위로 올릴수록 문자나 기호가 커지게 됨


또한 알로는 기본적으로 다수의 스티커를 제공하여 메시지 대신 선택하여 표현할 수 있는 폭을 크게 넓혔음


<자료> beeborn


[그림 4] 구글 알로의 텍스트 크기 조정


◈ 알로의 또 다른 특징은 가상 비서를 메시징에 참여시킨 것으로, 구글 어시스턴트가 이용자들 간의 대화에 개입해 도움을 줄 수 있게 하였음


메신저에 가상 비서를 탑재하려는 시도는 오래 전부터 있어 왔는데, 독립된 계정을 갖고 불특정 다수와 메시지를 주고받는 형태의 가장 최근 사례로는 올해 5월에 인종차별 발언으로 서비스가 중단된 마이크로소프트의 채팅봇 테이(Tay)가 있음


이용자의 가상 비서 역할을 하는 채팅봇은 애플의 시리(Siri)를 거쳐 최근 아마존 에코(Echo)까지 점차 활용이 보편화되고 있는 추세임


이용자가 채팅 메시지 내용을 보고 관련된 내용을 자동으로 보여주는 형태로는 인공지능 메신저 마인드멜드(MindMeld)가 주목을 받고 있음


알로는 시리와 마인드멜드를 합쳐놓은 형태로, 마치 컨시어지 서비스처럼 이용자와 대화하며 도움을 주는 한편, 이용자간 채팅을 보고 있다가 도움이 필요하다고 판단하면 대화에 참여해 조언을 해 줌



<자료> Google


[그림 5] 대화 내용을 이해하고 관련 내용 추천


• 예를 들어 친구에게 이탈리아 요리 먹으러 갈까라고 메시지를 보내면, 어시스턴트가 문맥을 이해하고 근처의 이탈리아 음식점을 소개하는데, 여기에는 구글 지식 그래프(Google Knowledge Graph) 기능이 사용되고 있음


지식 그래프는 다양한 정보원으로부터 축적한 시맨틱 검색 정보를 사용하여 검색 결과를 향상시키는 것으로 구글이 사용하는 지식 베이스(전문가 시스템)


어시스턴트가 소개한 레스토랑 카드를 터치하면 상세 정보가 나타나며 매장 사진 등을 볼 수 있는데, 마음에 들면 그대로 예약 할 수 있으며, 단 레스토랑 예약은 전용 앱인 오픈테이블(OpenTable)을 실행시키고 이 앱에서 예약을 하는 구조임


아직 알로에서 직접 예약할 수는 없지만, 올해 구글, MS, 페이스북이 일제히 제시한 채팅봇 메시징 플랫폼이 구현되면 알로가 예약 앱의 채팅봇과 대화를 하며 예약을 처리하게 되므로, 사용자는 알로에게 예약 요청만 하면 될 것임


알로의 대화 참여는 사용자 간의 대화를 뒤에서 누군가 지켜보고 있는 것 같은 좋지 않은 느낌을 주기도 하지만, 사용해 본 이용자들은 대체로 편리한 기능이라는 평가


◈ 가상 비서는 이용자들 간의 대화에만 적용되는 것이 아니며, 당연히 직접 어시스턴트와 상호작용하며 개인 비서처럼 활용할 수 있음


어시스턴트가 지원할 수 있는 작업 유형은 카드로 제시되는데, 뉴스 구독, 타이머 설정 등을 위한 액션(Action), 게임 등을 위한 재미(Fun), 번역, 날씨, 여행, 스포츠, 질의 응답을 위한 대답(Answer), 어시스턴트의 자기 소개인 마이 어시스턴트 등임



• 가령 여행 카드를 터치하면 여행 관련 정보가 표시되며, 조건을 좁혀 가며 희망하는 항공편이나 도착지의 호텔 검색을 할 수 있는데, 여기서도 항공편 및 호텔 예약은 링크된 웹사이트에서 이루어지며 아직 어시스턴트에서 직접 예약할 수는 없음


어시스턴트는 구글 캘린더와 연동해 이용자의 일정을 파악하고 비서처럼 회의 일정 등 관리하는데, 예약해 놓은 항공편의 정보를 보여줄 수 있고, 다음 일정에 대해서도 알려줄 수 있음



<자료> Google


[그림 6] 구글 어시스턴트와 연동해 일정관리


검색을 지시할 수도 있는데, 가령 개 사진 혹은 강아지 사진이라고 말하거나 입력하면, 구글 이미지 검색 결과를 이용해 원하는 사진을 추천해 줌


◈ 구글의 CEO 순다 피차이는 알로의 가상 비서 기능의 도입에 대해, 지금 현재 구글에서 제일 중요한 순간이라며 큰 의미를 부여


피차이는 ‘단지 웹 링크 하나를 던져놓는 것과는 차원이 다르며, 이 순간을 위해 아주 오랫동안 초석을 다져왔다는 말로 높은 기대감을 표시하고 있음


• 구글 그룹 제품 담당 책임 아밋 풀레이는, ‘사용자들은 친구나 가족과 계속 관계를 유지하기 위한 수단으로 메신저를 사용하지만, 대화가 너무 자주 끊기는 것이 문제라며, ‘대화는 그대로 유지하면서 메신저 내에서 모든 검색과 질문을 해결하는 메신저로 알로를 개발했다고 설명


알로의 메시징 기능들은 사실 참신하다고 할 수는 없지만, 구글 측의 기대대로 구글 어시스턴트를 이용한 대화형 AI라는 인터페이스는 편리하다는 느낌을 준다는 평가


어시스턴트가 구글 검색을 이용할 수 있는 인터페이스를 제공하는 것인데, 어시스턴트의 기능 대부분을 음성으로 이용할 수 있다는 것이 상호작용성을 높이고 있음


구글 음성 검색과 알로의 어시스턴트를 이용하는 것에 내용 상의 차이는 없지만, 바로 이 상호작용성이 큰 차이를 만들어 내게 되는데, 알로는 대화형이므로 검색 결과 제시로 끝나는 것이 아니라 계속 대화가 진행될 수 있다는 데서 여러 가능성이 생김


비록 가상 비서지만 대화 상대라는 인식이 생기면, 사용자는 검색 결과를 보고 추가로 말을 걸거나 추가 요청을 하고 싶은 마음이 생길 수 있으며, 이는 곧 알로의 이용시간이 늘어나며 생활의 새로운 플랫폼으로 부상할 가능성을 획득할 수 있음을 의미


• 순다 피차이 CEO가 지금이 구글에서 제일 중요한 순간이라 말한 것은 이런 맥락일 것이며, 바꿔 말하면 구글에 지금 가장 필요한 것은 알로의 성공이라 할 수 있음


◈ 일각에서는 알로가 유력 메시징 플랫폼으로 부상하며 구글의 AI 비즈니스를 진일보시킬 수도 있겠지만, 프라이버시 이슈 등에 대한 현명한 대처가 전제되어야 한다는 점을 지적


인공지능과 메신저의 결합은 분명 성장 가능성이 가득한 기회의 땅으로 부상할 수 있으나, 알로의 인공지능 기능은 프라이버시를 침해하는 존재가 될 수도 있음


사용자들이 알로에서 인공지능 기능을 활용하려면 구글에 연락처, 대화 내용, 상세한 개인 정보 등의 접근 권한을 허락해야만 하기 때문임


이런 이슈에 대한 대응으로 알로는 보안 옵션을 두고 있는데, 익명 모드(Incognito Mode)를 선택하면 알로의 메시지는 암호화 되며, 또한 스냅챗(SnapChat)처럼 메시지 노출 시간을 10초로 설정해 놓으면 10초 후 메시지가 자동으로 사라짐



<자료> Google


[그림 7] 구글 알로의 익명 모드와 메시지 자폭


메시지 자폭은 스냅챗이 10대들의 인기를 단박에 끌어 모을 수 있었던 핵심 기능으로 주목적은 성적인 대화와 사진 전송 기록이 남지 않도록 하는 것임


알로를 일반 모드로 사용하면 메시지가 암호화되지 않는데, 해시 처리(HTTPS의 프로토콜)에서 최소한의 보안이 제공되기는 하지만 알로는 분명 도청에 약점이 있음


페이스북 메신저 역시 암호화 옵션(비밀 대화)을 지정하지 않으면 메시지가 암호화되지 않는 등 이 문제는 비단 알로 만의 이슈는 아니나, 알로의 경우 메시지를 암호화하게 되면, 알로가 이용자간 대화에 참여하는 핵심 기능을 사용할 수 없는 문제가 발생


◈ 구글은 당초 방침을 바꿔 알로에서 주고 받는 메시지를 장기 보관하기로 결정했는데, 메시징 비즈니스라는 신대륙과 프라이버시 사이에서 고민하는 흔적을 볼 수 있음


구글은 알로에서 주고받는 메시지를 일시적으로 사용할 수 있지만 장기적으로 서버에 보관하는 것은 아니라고 했으나, 이 방침을 바꾸어 메시지 장기 보관 원칙을 밝혔음


보관의 목적은 AI의 교육에 사용할 데이터를 모으기 위함인데, AI를 보다 지능적으로 만들기 위해서는 기계학습이 필요하고, 기계학습을 위한 가장 좋은 교재는 결국 사용자들 간의 대화 내용이므로 장기간 보관을 단행할 수밖에 없었다는 것


이에 대해 당연히 우려의 목소리도 높은데, 전직 CIA NSA 요원인 에드워드 스노우든은 구글이 보관한 메시징 데이터가 범죄 수사 등에 이용될 것을 우려하며, 알로를 사용하지 말 것을 호소하고 있음


알로 역시 스마트 기술의 장점과 프라이버시 침해 기술의 단점을 동시에 지녔기 때문에, 초기의 관심 만을 놓고 알로의 성공이 보장된 것이라고는 말할 수는 없을 것이며 개인정보보호화 스마트 기능 사이의 균형이라는 오래된 숙제를 풀어야 하는 입장


AI 기술의 발전에 따라 인간과 기계의 협업이 새로운 화두로 떠오르고 있는 지금, 알로의 등장은 대화형 AI가 거대 비즈니스로 성장할 가능성의 단초를 보여주고 있음


알로는 현재 미리보기 판(Preview Edition)으로 표시되어 있으며, 사용해 보면 아직 개발 과정 중에 있는 베타 제품이라는 인상이 강하며, 생활의 필수 플랫폼이 될 것이라고 확실히 말하기 어려운 상태


반면 알로는 인간과 기계의 관계라는 측면에서 큰 잠재력을 보여주고 있는데, 특히 어시스턴트와 상호작용 하는 인터페이스에서 온기를 느낀다는 평가가 다수


음성 검색에서 기계적으로 결과를 표시하는 것과 달리, 가상 비서와 말을 주고 받으면서 목적을 달성 할 수 있다는 것은 미래의 모습을 미리 보여주는 것이기도 함


구글이 AI 비즈니스에 전사적 노력을 쏟아 붓고 있고 알로는 그 로드맵의 첫 단추인 만큼 향후 알로의 기능은 보다 정교화 되고 다양해질 것이며, 이는 필연적으로 경쟁 서비스들의 등장을 불러 일으키며, 또 하나의 새로운 비즈니스 영역이 구축될 전망

※ 다음 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1760호(2016. 8. 24 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

인공지능 이용 광고카피 작성시스템 퍼사도(Persado).pdf



[ 요 약 ]


인공지능(AI)이 생성하는 문장은 기계적이며 대략 의미는 알겠지만 그 이상은 아니라고 생각한 적이 있었으나, AI는 이미 스트레이트성 기사를 쓰고 있으며 나아가 사람의 마음을 움직이는 광고 메시지 작성도 가능하게 되었음. 인간 카피라이터의 상상력을 능가한다는 평가까지 받고 있는 메시지 작성 알고리즘 "퍼사도(Persado)"는 온라인 광고, 환자관리, 고객관리, 선거운동 등 다양한 방면에서 활용되고 있으며, 또 하나의 AI에 의한 전문직종 대체 사례로 거론되고 있음



[ 본 문 ] 


◈ 미국의 벤처기업 '퍼사도(Persado)'는 기계학습과 자연언어처리 기술을 이용해 소비자 행동을 고무하는 메시지를 생성하는 시스템을 개발, 서비스하고 있음


이 시스템은 "인지적 콘텐츠 플랫폼(Cognitive Content Platform)"이라 부르는 알고리즘을 이용해 사람의 마음을 움직이는 콘텐츠를 생성한다고 함



<자료> Blue-Digital


[그림 1] 카피 작성 시스템 퍼사도 로고



• 퍼사도의 기능은 주로 웹사이트나 메일, 페이스북 등에 삽입되는 캠페인 메시지를 생성할 때 사용된다고 하는데, 이미 많은 기업에서 사용하고 있음


퍼사도는 퍼사도 엔터프라이즈(Persado Enterprise)퍼사도 고(Persado Go)라는 서비스 상품을 제공 중인데, 퍼사도 엔터프라이즈는 풀 스펙의 플랫폼이며, 퍼사도 고는 기능을 보다 단순화 한 버전임


최근에는 검증된 파트너에 한해 퍼사도 시스템을 기업의 내부 워크플로우와 통합하는퍼사도 커넥트(Persado Connect)를 출시했는데, 페이스북, 어도비, 오라클, 세일즈포스닷컴, 더블클릭 등 유수의 기업이 연계하고 있음


퍼사도의 활용 사례를 보면, 가령 여행사들이 보통 '기간 한정, 저렴한 항공편 지금 예약하세요'와 같은 광고 메시지를 내보내는 것에 비해, 퍼사도는 나 자신에게 일생에 남을 여행을 선물해 보세요. 지금 출발할까요'와 같은 카피를 만들어 내고 있음


위의 사례만 보면 퍼사도가 훨씬 친근감 있는 표현을 구사함을 알 수 있으며, 퍼사도는 실제로 사람이 만든 광고 메시지에 비해 AI가 생성한 메시지를 사용했을 때 전환율(상품을 구매하는 비율)이 평균 49.5% 증가했다는 자체 통계를 내세우고 있음


마이크로소프트, 메트라이프, 버라이즌, 씨티은행 등 퍼사도를 이용하고 있는 약 100 개의 기업들이 퍼사도를 이용해 총 10억 달러 이상의 매출을 증대시켰다는 주장


인공지능이 인간보다 더욱 매력적인 메시지를 창작해 낼 수 있다는 가능성을 인정받아, 퍼사도는 올해 4월 골드만삭스로부터 3천만 달러를 투자 받았음



<자료> Persad


[동영상퍼사도의 카피라이팅



[1] 퍼사도를 이용한 카피의 재작성 사례

적용분야

기존 카피

퍼사도 작성 카피

배너 광고

Limited Time Flight Deals. Book it

Treat yourself to a trip of a lifetime. Let's Go

환자 복약 관리

It's 4:30. Please take your prescribed medication.

Time for your medicine, Charles. Your Family needs you strong and healthy!

데이팅 사이트

Sup? Would you like to go out tonight?

It's an awesome day to hang out in the park. Right?

<자료> Persado


◈ 퍼사도의 인지적 콘텐츠 플랫폼에는 우선 마케팅 메시지와 관련된 대규모 데이터베이스와 메시지에 사용된 어휘를 분석하기 위한 사전(ontology)이 자리잡고 있음


퍼사도는 광고 메시지를 통계 기법에 따라 생성한다고 하는데, 수많은 사례에 대한 학습을 통해 전환율을 높일 수 있는 단어의 배열을 생성하는 것이라고 함


알고리즘은 마케터들이 주로 사용하는 카피라이팅 약 100만 단어와 문구를 축적해 메시지가 각 사용자에게 제공하는 감정을 분석한 후, 메시지 형식, 문장의 구조, 감정적인 단어의 행위 유발에 따른 마케팅 소구 등을 기반으로 점수화 하게 되며, 이를 토대로 메시지를 작성한 다음 최적화하여 23개 언어로 번역하게 됨


퍼사도는 우선 말을 세 가지 범주로 분류하는데, 첫번째 서술(Descriptive) 범주에는 묘사와 설명을 하는 단어와 문장들이 속하며, 두번째 감정(Emotional) 범주에는 소비자의 감정에 호소하는 언어들이 속하고, 세번째 기능(Functional) 범주에는 '버튼을 클릭하세요' 등과 같이 다른 행위들과 이어지는 행위와 관련해 설명하는 말들이 포함됨


감정 범주로 구분되는 말들은 다시 감정적 언어(Emotional Language)라 불리는 트리 구조로 분류되는데, 크게 긍정적(Positive)부정적(Negative)으로 분류되며, 그 아래 다시 소분류들이 이어짐


가령 긍정적(Positive) 범주 아래에는 기쁨(Joy), 성취(Achievement), 격려(Encourage) 등의 소분류가 있음


 이런 분류 체계는 감정의 사전(Ontology of Emotion)이라 불리며, 어휘의 의미와 함께 다른 어휘와의 관계를 보여주는데, 사전은 약 25만 단어로 구성되어 있다고 함




<자료> Persad


[동영상퍼사도 작동 방식



◈ 인지적 콘텐츠 플랫폼은 정의된 감정적 언어를 이용해 메시지를 생성하는데, 이 알고리즘은 기계학습을 통해 강화됨


퍼사도는 감정적 언어 분류 체계를 사용하여 콘텐츠를 생성하는데, 단어 퍼즐을 풀 듯 단어를 조합하여 메시지를 생성한다고 함


감정적 언어 체계에서 동일하게 긍정적 분류에 속하는 말들이라고 해도 그 효과는 크게 다른데, 가령 고급스러움(Exclusivity)은 크게 도움이 되는 쪽으로 작용하지만, 흥분(Excitement)은 반대로 마이너스 작용을 함


퍼사도는 수많은 벤치마크를 통해 효과를 분석함으로써 문자열을 최적화 해 나가게 되는데, 이 때문에 단어 퍼즐을 푸는 듯이 메시지를 생성한다고 하는 것임




<자료> Persado


[그림 2] 감정의 사전(ontology)


 퍼사도는 과거의 캠페인에서 쓰였던 메시지 샘플을 수집한 후, 이것들을 시스템으로 수정, 편집한 다음 반복해서 효과를 검증해 나가는 방식, 즉 생성된 메시지의 효과를 측정하고 기계학습 기법으로 기능성을 계속 높여 나가는 방식을 채택하였음


◈ 이처럼 퍼사도는 감정 카테고리로 분류되는 말을 유효하게 조합하는 기법을 통해 사람의 마음을 움직이는 메시지를 생성하는데, 그 효과는 많은 캠페인에서 입증되고 있음


아메리칸 익스프레스(American Express)의 경우 배너 광고의 카피를 퍼사도를 이용해 수정하였는데, 퍼사도로 카피를 만들면서 소비자의 클릭 비율이 약 3배 가량 늘었다고 하며, 전환율 역시 약 2.5 배가 되었다고 함


언뜻 보면 기존에 카피라이터가 작성한 카피와 퍼사도가 작성한 카피 사이에 큰 차이는 없어 보이지만, 벤치마크에서는 이처럼 크게 차이가 났음




<자료> Persado


[그림 3] 퍼사도를 이용한 아메리칸 익스프레스의 광고 카피 수정 성공사례


 퍼사도가 사용한 곧 종료(Ends Soon)라는 말이 긴장감을 부추기고 소비자에게 구매를 서두르게 한 것이라 해석할 수는 있지만, 퍼사도 시스템은 정확하게 전환율이 높아진 이유까지는 해명할 수 없다고 하며, 이 점은 아직까지 AI 역량의 한계이기도 함


◈ 퍼사도는 광고 캠페인뿐 아니라 다양한 분야에서 활용 방식을 개발하고 있는데, 그 중 하나가 디지털 헬스케어 분야에서 병원과 환자간 효과적 의사 소통하는 방법의 개발임


오바마케어의 목표에 따라 미국 의료기관들은 환자를 치료하는 일뿐만 아니라 질병관련 표준 치료 프로세스를 확립하고, 치료 효과를 높이며 비용을 낮추는 방향으로 업무를 개선하는 방안을 연구하고 있음


이러한 연구를 임상경로 개발(Clinical Pathway)이라 부르는데, 퍼사도와 의료기관들은 우선 당뇨병이나 고혈압 환자의 치료에 시범사업을 시작하고 있음


의사는 환자에게 치료를 위한 지도를 함에 있어, 어떻게 환자를 납득시킬 것인가 하는 부분에서는 퍼사도의 기술을 활용하게 됨


가령 당뇨환자가 온라인 사이트에서 식사 지도를 받을 때, 어떤 순서의 단어 배열이 환자를 보다 잘 설득하고 실제 행동으로 이어지게 하는지를 연구하고 있음


또한 복약 지도에도 활용이 되는데, 가령 환자에게 약을 복용하라는 메시지로는 4시가 되었습니다. 처방한 약을 복용하세요 등이 일반적이지만, 퍼사도는 할아버지, 약 먹을 시간이에요. 당신 가족들은 당신이 건강하기를 원해요라는 메시지를 생성함



<자료> Persado


[그림 4] 동기 강화 웨어러블 메시지



• 이처럼 미국 의료기관들은 환자를 의사가 자의적인 방식으로 이끌게 하는 것이 아니라, 환자가 건강한 생활을 하도록 촉진하기 위해 어떻게 설명해야 하는지에 대한 연구를 퍼사도와 공동으로 수행하고 있음


최근 헬스케어 분야의 주요 컨셉인 계량화 된 자아(Quantified Self)', 즉 소비자가 웨어러블 기기 등을 통해 신체 데이터를 수집하고 이를 건강 유지를 위해 활용하려는 움직임에도 퍼사도를 이용할 수 있음


애플워치 등의 웨어러블 기기에도 건강 관리를 위해 메시지가 표시되지만, 소비자의 대부분은 이를 기분 좋게 받아들이고 있지 않음


디스플레이에 일어날 시간입니다와 같은 메시지가 표시되더라도 이 메시지를 보고 행동에 옮기는 사람은 많지 않은데, 이 점에 관련해 퍼사도는 이용자의 동기를 높여 주는 메시지는 어떻게 작성되어야 할 것인지를 연구하고 있음


◈ 이 밖에 금융기관, 공공 서비스 기관 등도 퍼사도에 관심을 보이고 있는데, 주로 고객관리 관점에서 사용자의 지불을 효과적으로 이끌어 내는데 목적이 있음


금융기관들은 퍼사도의 활용에 대해 높은 관심을 보이고 있는데, 매일매일의 트랜잭션에 대한 메시지를 퍼사도로 생성하여 더 많은 유동성을 이끌어 내기를 기대하고 있음


위성 라디오 업체인 시리우스 XM은 이용자들이 요금을 지체 없이 납부하도록 유도하기 위해 전달하는 메시지를 퍼사도로 만들고 있음


요금 납부가 늦어지면 가령 전기 회사의 경우 현재 전기 중단과 같은 위협적 메시지를 보낼 뿐이나 이를 기분 좋게 받아들일 소비자는 없음


반대로 카드 결제가 연체되었을 때 카드회사가 바쁘신 것은 알겠지만..이라고 말해주면 조금이나마 기분이 편해질 수 있을 것임


이처럼 소비자에게 지불을 촉구하는데 어떤 문자 배열이 최적인지 알아내기 위해 퍼사도는 아메리칸 익스프레스 등과 공동으로 개발을 진행하고 있음


◈ 또한 다른 사람의 환심을 사기 위해 퍼사도를 활용하기도 하는데, 데이트 앱 서비스에서 활용되고 있으며, 최근에는 정치 캠페인과 선거 운동에서 활용도 점쳐지고 있음


미국에서는 데이트 상대를 찾는 앱이 폭넓게 사용되고 있는데, 위험한 것들도 있지만 대부분의 앱은 만남 상대를 찾기 위한 유용한 도구로 일상생활에 자리잡고 있음


틴더(Tinder)처럼 젊은이들 사이에 폭발적으로 확산된 앱도 있는데, 퍼사도는 틴더 앱의 기능으로 포함되어 남자가 여자를 초대할 때의 메시지 작법에 대해서 조언하고 있음


여성에게 오늘밤 밖에 나가고 싶지 않아?라고 해서는 안되고, 오늘은 야외에서 어울리기에 멋진 날이군요?라는 식으로 말하라고 지도해 주는데, 얼마나 효과가 있는지 벤치마크 결과는 공개되어 있지 않지만, 퍼사도는 새로운 활용 모델이 될 것으로 기대하고 있음


선거에서 유권자에게 전달하는 메시지의 생성에도 퍼사도가 사용되고 있는데, 선거는 이미 SNS나 메일, 메시징 등 디지털 싸움이 되고 있기 때문



<자료> Hillary Clinton


[그림 5] 선거 운동에 활용되는 퍼사도


• 유권자 모임 등 캠페인 활동에 참여를 촉진하기 위해, 또한 자원봉사 활동 참가자를 모집하기 위해 퍼사도가 사용되고 있는데, 퍼사도는 어떤 단어의 배열이 효과적인지 그 결과까지 검증해 주고 있음


미국은 현재 민주, 공화 양당의 대통령 후보가 정해지고 본격적인 선거전이 시작되었는데, 양 진영의 선거 캠프에서 유권자에게 전달하는 메시지를 퍼사도와 같은 인공지능으로 만들고 있을 가능성도 배제할 수 없음


◈ 최근 관심이 높아지고 있는 퍼사도의 기술을 행태주의 마케팅(Behavioral Marketing)으로 볼 것인지, 심리학(Psychology)으로 볼 것인지에 논란이 계속되고 있음


전자는 소비자의 행동에 따른 광고 기법을 의미하는데, 소위 타겟팅 광고에서 골프 뉴스를 보고 있으면 골프 제품의 광고가 표시되는 방식이며, 후자는 심리학에서 소비자의 심리를 이해하고 광고를 전달하는 방법을 가리킴


메시지를 받은 소비자가 어떻게 생각할 것인지에 대해 퍼사도는 파악할 수 없으며, 다만 퍼사도는 소비자가 특정 메시지를 받으면 그것에 어떻게 반응하는지를 경험적으로(결과적으로) 파악하고 있음


퍼사도는 행태주의 마케팅과 심리학의 경계에 서 있는 회사로 자리매김 할 수도 있고, 또한 퍼사도를 말을 엔지니어링 하는 기업으로도 정의할 수 있을 것임


◈ 그러나 기술의 성격이 무엇이냐 보다 중요한 것은, 이미 미국 시장의 큰 흐름은 텍스트를 사람이 직접 작성하는 방식에서 알고리즘을 통해 생성하는 방식으로 바뀌고 있다는 점


알고리즘은 이미 주가 정보나 스포츠 경기 결과처럼 단순 사실 전달이 목적인 스트레이스성 기사 작성에 활용되고 있는데, 인터넷 미디어에서만 실험적으로 진행되는 것이 아니라, 포브스 등 유수의 미디어들도 적극적으로 도입하고 있음


퍼사도는 여기서 한발 더 나아가 사람의 감정에 어필해야 하는 메시지 작성에 알고리즘을 이용한 것이고, 보다 주목할 것은 알고리즘이 인간 카피라이터보다 효과적인 메시지를 생성할 수도 있다는 점


이 때문에 시장에서는 이제 인공지능이 카피라이터의 일자리도 빼앗는 것이 아니냐는 위기감도 나오고 있음


다른 한편에서는 퍼사도는 어디까지나 인간의 창작 활동을 지원하는 도구에 불과하다는 의견도 내놓고 있기도 함


인간이 쓴 글을 퍼사도가 다듬어 손질할 수도 있고, 아니면 그 반대로 활용할 수도 있을 것이며, 현재 글을 쓸 때 맞춤법 검사기를 돌려보는 것처럼, 앞으로는 워드 프로세서로 쓴 글을 퍼사도가 첨삭하는 식으로 이용할 수도 있다는 것


인간을 대체할 것이라거나 인간의 도구가 될 것이라거나, 어느 쪽도 일리가 있는 의견이지만, AI가 꾸준히 인간의 일에 근접해 들어오고 있다는 것은 확실해 보임