'주간기술동향 최신ICT이슈/인공지능(AI)' 카테고리의 글 목록

Search

'주간기술동향 최신ICT이슈/인공지능(AI)'에 해당되는 글 53건

IBM 100만 명 얼굴 정보 담은 데이터셋 공개, 인식의 공정성이 목표

주간기술동향 최신ICT이슈/인공지능(AI) 2019. 4. 18. 18:22 Posted by Purple Frog

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1884호(2019. 2. 19. 발행)에 기고한 원고입니다.

▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

IBM 100만 명 얼굴 정보 담은 데이터셋 공개, 인식의 공정성이 목표.pdf

0.52MB

◾ IBM 기초연구소는 최근 얼굴인식 기술의 공정성과 정확성 향상을 목표로 ‘얼굴의 다양성(Diversity in Faces, DiF)’라는 데이터셋을 공개

▸ 카메라와 알고리즘을 이용해 얼굴을 인식하여 개인을 식별하는 기술의 실용화는 최근 급속히 확대되고 있으며, 스마트폰의 잠금 해제에 Face ID 등의 얼굴 인식 시스템이 이용되기도 하고, 경찰의 수사 및 경비에 얼굴 인식 시스템이 도입되어 일부 성과를 올리고 있기도 함

▸ 그러나 얼굴 인식 시스템의 정밀도는 아직 완벽함과는 거리가 있는데, 가령 영국 경찰이 도입한 얼굴 인식 시스템의 경우 오판정률이 90%가 넘는 일도 있었음

▸ 2017년 6월 영국 카디프에서는 UEFA 챔피언스 리그 결승전이 열렸는데, 대규모 스포츠 이벤트는 테러의 표적이 될 가능성이 높아 당시 뉴 사우스 웨일즈 경찰은 감시 카메라를 이용한 자동 얼굴인식 시스템으로 범죄 용의자를 탐지해 내겠다는 계획을 세웠음

▸ 결승전 당일 자동 얼굴인식 시스템에 의해 범죄 용의자로 지목된 사람은 모두 2,470명에 달했는데, 이 중 2,297명이 잘못된 판정으로 드러났음

▸ 웨일즈 경찰의 사례에서 오판정률이 높았던 원인은 인터폴에서 제공한 용의자 사진의 화질이 떨어졌기 때문인데 그 외에도 얼굴인식 시스템의 정확도는 여러 요인에 의해 영향을 받음

▸ 오인식 비율이 높아지는 원인 중에는 ‘얼굴인식 시스템의 편향성’도 있다는 지적이 있는데, 실제로 아프리카계 미국인은 백인보다 5~10% 정도 정확도가 떨어진다는 연구 결과가 있음

▸ IBM 기초연구소의 연구팀은 실제 얼굴인식 시스템의 성능에 영향을 미치는 것은 ‘내재적인 얼굴의 다양성’이지 인식의 정확도가 개인이나 집단에 따라 달라질 수는 없다는 입장인데, DiF 데이터셋의 공개 목적이 얼굴인식 기술의 ‘공정성’ 향상이라 한 것은 이런 연유임

◾ 이번에 IBM이 공개한 DiF에는 다양한 성별과 인종의 얼굴 이미지와 그에 대한 주석이 포함되어 있는데, 약 100 만 명분의 데이터가 포함되어 있다고 함

▸ IBM 연구소는 만일 인종이나 성별에 따라 얼굴인식의 정확도에 차이가 발생한다면, 이는 알고리즘을 학습시킬 데이터셋이 특정 성별이나 인종에 편중되어 있기 때문으로, 데이터셋의 표본을 늘리고 인종과 성별의 샘플링을 균형있게 함으로써 해결가능하다고 보았음

▸ DiF 데이터셋의 각각 이미지에는 머리 모양과 얼굴의 대칭, 코의 길이, 이마의 높이 등 얼굴의 객관적 척도와 함께 연령이나 성별 등의 주석 데이터가 라벨링되어 있다고 함

▸ 연구팀에 따르면 주석 데이터에서는 얼굴 부위 47곳 이상의 크기와 특징을 정리되어 있으며, 이것이 얼굴인식 시스템의 공정성과 정확성을 향상시키고 알고리즘의 성능을 더욱 강력하게 만드는 학습 교사의 역할을 하고 있음

▸ 연구팀은 IBM 기초연구소에서 보다 공정하고 정확한 얼굴인식 시스템을 개발하기 위한 연구 노력을 계속하고 있지만, 단지 자신들의 연구로만으로 얼굴인식 시스템이 발전할 수는 없다고 판단하였음

▸ DiF를 공개한 것은 이를 통해 다른 곳에서 진행되는 얼굴인식 시스템의 연구에도 기여하는 것이 중요한 과학적 의제를 진전시키는 일이라 보았기 때문이며, 이번에 공개된 DiF가 얼굴인식 시스템 연구의 새로운 첫 걸음이 되기를 희망하고 있음

▸ DiF 데이터셋은 전세계에 있는 얼굴인식 시스템 연구 커뮤니티에 제공되는데, DiF에 접속을 원하면 IBM 기초연구소의 설문 조사에 응하고 이메일로 신청하면 됨

▸ Diversity in Faces Dataset - Trusted AI - IBM Research AI(https://www.research.ibm.com/artificial-intelligence/trusted-ai/diversity-in-faces/)

◾ 한편 DiF를 기반으로 한 시스템 개발 연구를 통해 얼굴인식의 공정성과 정확성 개선이라는 목표는 달성될 수 있겠지만, 그에 비례해 기술에 대한 통제 요구도 커질 것으로 보임

▸ 2017년 뉴 사우스 웨일즈 경찰의 얼굴인식 시스템이 2천명 이상의 시민을 범죄 용의자로 오판한 것이 알려지자, 영국에서는 즉각 시스템 폐지 운동이 전개된 바 있음

▸ 영국의 시민단체 ‘빅브라더 워치(Big Brother Watch)'는 실시간 얼굴 인식은 시민의 자유에 대한 위협일 뿐만 아니라 위험하고 부정확한 정치적 도구라며 강력히 비판하고 있는데, 기술의 정확성 여부와 상관없이 얼굴인식 기술에 대한 근원적 문제제기는 지속될 것으로 보임

저작자표시 비영리 동일조건

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

페이스북, 사진의 특정 부분을 터치하면 AI가 상황을 설명해주는 서비스 (0)	2018.11.28
페이스북, AI로 소프트웨어 버그 수정하는 SapFix 시스템 공개 (0)	2018.11.14
웨더뉴스-엔비디아, AI 이용한 전세계 강우 상황 가시화 프로젝트 (0)	2018.09.28
싱가포르 정부,‘AI 거버넌스 프레임워크’ 구축의 방법론 제시 (0)	2018.09.12
전세계 디지털 혁신 공급망을 꿈꾸는 캐나다의 AI 수퍼클러스터 (0)	2018.08.31

페이스북, 사진의 특정 부분을 터치하면 AI가 상황을 설명해주는 서비스

주간기술동향 최신ICT이슈/인공지능(AI) 2018. 11. 28. 10:47 Posted by Purple Frog

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1874호(2018. 11. 28. 발행)에 기고한 원고입니다.

▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

페이스북, 사진의 특정 부분을 터치하면 AI가 상황을 설명해주는 서비스.pdf

◾ 페이스북은 스마트폰에 표시된 사진의 특정 부분을 손가락으로 터치하면, AI(인공지능)가 그 부분이 어떤 내용과 상황인지 말해주는 사용자 지원 기술을 개발하고 있음

▸ AI가 사진 속 사람과 사람의 위치 관계 등 사진이 담고 있는 컨텍스트(맥락)를 설명하게 하는 기술로, 이를 활용하면 우선 시력장애인들에게 유용한 UI를 만들 수 있음

▸ 11월 15일 샌프란시스코에서 개최 된 ‘뉴 컨텍스트 컨퍼런스(New Context Conference)’에 등단한 '페이스북 제품 디자인 담당 부사장 마가렛 스튜어트는 시각 장애인의 UI 개선을 위해 페이스북이 해온 노력의 과정을 설명하였음

▸ 페이스북은 이미 지난 2016년 4월부터 시각장애인의 ‘웹 접근성(Web Accessibility)’ 개선 노력의 일환으로 페이스북에 게시된 사진의 피사체를 AI가 말해주는 ‘Automatic Alternative Text(자동 대안 텍스트)’ 기능을 제공 중에 있음

▸ 피사체가 무엇인지 식별하는 이미지 인식 기술과 사진에 대한 설명(캡션)을 자동으로 생성하는 자연언어처리 기술을 결합하여 개발한 것인데, 스튜어트는 이 기능에 대해 ‘나름 쓸모있기는 하지만, 가령 사람과 사람의 위치관계 등 사진에는 있는 컨텍스트가 빠져있다’고 지적

▸ 이런 문제점을 개선하고자 페이스북은 현재 사진의 컨텍스트도 AI가 이해하여 이를 사용자에게 전달하는 기술을 개발 중이라고 함

◾ 개발 중인 기술은 이미지 인식 기술뿐만 아니라, 이미지에 비친 피사체의 영역을 식별하고 세분화하는 기술과 인물의 표정을 식별하는 표정 인식 기술, 문자 인식(OCR) 기술 등을을 결합

▸ 가령 케익과 축하 카드가 있는 사진의 경우 ‘Happy Birthday’라고 쓰인 카드 부분을 손가락으로 터치하면 AI가 ‘Happy Birthday’라고 말해주며, 포크와 나이프, 케이크 영역을 손으로 터치하면 그 객체가 무엇인지 AI가 알려줌

<자료> ITPro

[그림 1] 사진 속 특정 영역을 설명

▸ 피사체가 인물인 경우에는 얼굴 부분을 터치하면 그 사람의 이름이나 표정을 말해주고, 옷 영역에 손이 닿으면 그 사람의 복장상태까지 알 수 있게 해줌

▸ 마가렛 스튜어트 부사장은 남편과 함께 찍은 사진을 터치하는 데모를 보여주었는데, AI는 ‘마가렛이 미소 짓고 있다’, ‘(남편) 데이빗은 넥타이를 매고 있다’라고 말해주었음

▸ 스튜어트는 ‘남편이 타이를 매는 것은 매우 드문 일이기 때문에 타이 착용 여부를 아는 것이 간혹 중요할 수도 있다’라며, AI로 사진 속 맥락을 전달하는 기술의 의의를 설명하였음

▸ 이 새로운 사용자 지원 기술은 아직 프로토타입 단계라고 하며, 실제로 사용할 수 있는 시기는 아직 정해지지 않았다고 함

<자료> ITPro

[그림 2] 인물 사진의 세부 영역을 설명

◾ 페이스북은 새로운 사용자 지원 기술에서 AI가 담당하는 역할은 ‘사람들을 동등하게 대우함으로써 모두가 커뮤니티에 참여할 수 있도록 하는 것’이라 말하고 있음

▸ 스튜어트 부사장은 AI는 지금 모든 영역을 바꾸어 가고 있다며, 스티브 잡스가 한때 ‘컴퓨터는 인간의 지성에 자전거와 같은 존재다’라고 말한 바 있지만, 거기에 비교하면 지금의 AI는 인간 지성에 로켓과 같은 존재라고 비유

▸ 그런 점에서 스튜어트는 AI가 인류에 대해 분명한 역할과 책임이 있다며, 제품 및 서비스 디자이너들이 AI가 모든 사용자들에 동등하게 작동할 수 있도록 고안하는 것이 아주 중요한 일이라고 호소(Designing AI With and For Humanity)

▸ 제품을 설계하는 디자이너는 사용자가 보는 화면의 한 픽셀에 대한 것이나 사용자의 개인적인 경험 등에 주로 신경을 쓰는 경향이 있는데, 그러나 AI 활용 여부가 큰 차이를 만들어 내는 이런 시대에는 픽셀보다 에코시스템 전체, 개인보다는 인류 전체를 생각해야 한다는 것

▸ 스튜어트는 디자인이란 ‘제품과 서비스가 사회에 주는 영향을 생각하는 행위’라며, AI가 사회와 인류에 대한 책임을 제대로 이행할 수 있도록 생각하는 것도 디자이너의 업무에 포함되어야 한다고 강조했는데 웹 접근성을 넘은 ‘AI 접근성’을 제시했다는 점에서 주목할 만함

저작자표시 비영리 동일조건

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

IBM 100만 명 얼굴 정보 담은 데이터셋 공개, 인식의 공정성이 목표 (0)	2019.04.18
페이스북, AI로 소프트웨어 버그 수정하는 SapFix 시스템 공개 (0)	2018.11.14
웨더뉴스-엔비디아, AI 이용한 전세계 강우 상황 가시화 프로젝트 (0)	2018.09.28
싱가포르 정부,‘AI 거버넌스 프레임워크’ 구축의 방법론 제시 (0)	2018.09.12
전세계 디지털 혁신 공급망을 꿈꾸는 캐나다의 AI 수퍼클러스터 (0)	2018.08.31

페이스북, AI로 소프트웨어 버그 수정하는 SapFix 시스템 공개

주간기술동향 최신ICT이슈/인공지능(AI) 2018. 11. 14. 15:57 Posted by Purple Frog

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1872호(2018. 11. 14. 발행)에 기고한 원고입니다.

▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

페이스북, AI로 소프트웨어 버그 수정하는 SapFix 시스템 공개.pdf

◾ 페이스북은 인공지능(AI)이 소프트웨어를 테스트하고 버그를 찾아 수정 패치를 개발하는 ‘SapFix(샙픽스)’ 시스템을 개발했으며 조만간 OSS(오픈소스소프트웨어)로 공개할 계획

▸ 페이스북은 지난 9월 실리콘밸리에서 개최된 대규모 시스템 개발 연구모임인 ‘@Scale Conference’에서 안드로이드용 앱의 버그를 수정해 주는 패치를 자동으로 생성해주는 디버깅 시스템 ‘SapFix(샙픽스)’를 공개하였음

▸ 샙픽스는 AI가 자동으로 앱을 테스트하여 버그를 찾고 수정 패치를 개발한 다음, 새로운 테스트 케이스를 만들어 다시 테스트 한 후 인간 엔지니어의 리뷰를 요구하는 시스템인데, 페이스북은 최근 조만간 샙픽스를 포함한 전체 디버깅 시스템을 OSS로 공개할 것이라 발표

▸ 페이스북의 디버깅 자동화 연구는 오래된 것이어서, 이미 2015년 6월에 정적 코드 분석 도구인 ‘Infer(인퍼)’를 OSS로 공개한 바 있고, 샙픽스 공개에 앞서 올해 5월에 안드로이드 및 iOS용 모바일 앱의 테스트 자동화 도구인 ‘Sapienz(사피엔즈)’를 공개한 바 있음

◾ 버그 수정 자동화 도구인 샙픽스가 추가됨으로써 페이스북은 AI를 이용한 디버깅의 완전 자동화를 실현하게 되었음

▸ 전체 디버깅 자동화 시스템은 사피엔즈와 인퍼가 자동으로 버그를 찾아내면 샙픽스가 그 버그를 수정하는 패치를 개발하고, 샙픽스가 만든 패치에 버그가 없는지 다시 사피엔즈와 인퍼가 테스트 한 다음 통과하면 인간 엔지니어에 리뷰를 요청하는 구조임

▸ 페이스북은 2017년 9월부터 자체 모바일 앱에 대해 사피엔즈로 자동 테스트를 시작했으며, 현재는 ‘페이스북’, ‘인스타그램’, ‘워크플레이스’, ‘메신저’ 등 여러 안드로이드용 앱에 테스트를 적용하고 있고, 올해 8월부터는 페이스북 앱의 버그 수정에 샙픽스 적용을 시작하였음

▸ 페이스북은 자사 기술 블로그를 통해 ‘이 정도 규모로 AI를 이용한 테스트 및 디버깅 자동화를 실제 운용하고 있는 사례는 페이스북이 처음일 것’이라며, 앞으로 사피엔즈와 샙픽스를 모두 OSS로 공개해 코드 수정이 빈번한 기업의 업무 효율성 제고를 지원하겠다는 의향을 표명

◾ 페이스북은 모바일 앱 테스트 자동화를 위해 자체 개발한 거대한 안드로이드 시뮬레이터 환경인 ‘One World(원 월드)’를 이용하는데, 이는 수천 대의 시뮬레이터로 구성되어 있음

<자료> Facebook

[그림 1] 페이스북의 안드로이드 앱 테스트 환경

▸ 원 월드는 안드로이드 시뮬레이터를 수백 대, 때로는 수천 대 가동시키고, 다수의 인간 사용자가 모바일 앱에서 하는 조작을 로봇이 사용자 인터페이스(UI)를 통해 실행하게 함으로써, 충돌 등 이상 동작이 발생하는지 여부를 체크하게 됨

▸ 사피엔즈는 원 월드 시뮬레이터 환경에서 실행하게 되는 검사를 자동 설계하는 시스템인데, UI에 대한 테스트 작업을 무작위로 실행시키는 랜덤 퍼지(Random Fuzzy) 방식이 아니라 인간 테스터가 설계한 것과 동일한 테스트를 한다고 함

▸ 구체적으로는 ‘탐색 기반 소프트웨어 엔지니어링(Search-based Software Engineering)’이라 불리는 기법을 사용함

▸ 이는 랜덤한 것까지 포함해 무수히 존재하는 테스트 케이스 중에서 테스트 범위는 넓어지고 단계는 짧아지는 최적의 조합을 고도의 알고리즘을 이용해 찾아내 테스트를 설계하는 것임

▸ 사피엔즈는 인간이 개발한 테스트 케이스를 수행할 뿐 아니라, 테스트 케이스의 일부를 변화시키거나 교체함으로써 새로운 테스트 케이스를 자동 생성하는데, 새로 만든 테스트 케이스가 잘 기능하면 그것을 더 변경하여 더 좋은 테스트 케이스를 만들어 감

▸ 사피엔즈는 앱의 충돌 등을 알아낼 때 소스 코드의 어떤 행이 충돌을 일으키게 하는 지도 특정해 주는데, 사피엔즈가 찾아낸 버그가 실제로는 버그가 아닐 비율은 낮은 편이며, 실제 페이스북 앱의 경우 발견된 버그의 75%는 바로 수정을 필요로 하는 버그였다고 함

◾ 사피엔즈가 찾아낸 버그를 수정하는 샙픽스는 4가지 방법을 순차적으로 적용해 나가는데, 마지막 네 번째 방식이 샙픽스가 직접 패치를 생성하는 것임

▸ 첫 번째 방법은 버그가 발생하기 직전에 소스 코드에 추가된 변경 사항을 전면적으로 취소하는 것이며, 두 번째 방법은 변경된 내용을 부분적으로 취소해 보는 것임

▸ 변경된 부분을 취소해도 버그를 수정할 수 없는 경우에는 세 번째 수단으로 사람이 미리 작성해 놓은 ‘수정 템플릿 모음’ 중에서 패치를 선택해 적용하게 됨

▸ 그래도 버그를 수정할 수 없다면 네 번째 수단이 발동되는데, 사피엔즈가 소스 코드에서 버그가 존재하는 행을 특정해 알려주므로 샙픽스는 행을 수정하는 패치를 직접 만들게 되며, 페이스북은 이를 ‘돌연변이 기반의 수정(Mutation-based fix)’이라 부르고 있음

▸ 샙픽스는 동시에 여러 개의 패치를 만들 수 있는데, ‘컴파일이 가능한가’, ‘충돌을 방지했는가’, ‘새로운 충돌을 만들지는 않는가’의 관점에서 여러 패치들을 체크한 후 실제로 버그를 수정할 수 있는 패치를 찾아 냄

▸ 샙픽스가 만든 패치는 인간이 만든 테스트 케이스뿐만 아니라 사피엔즈가 자동 생성한 테스트 케이스도 사용하여 시험하며, 이 테스트를 통과하면 인간 엔지니어에게 코드에 대한 리뷰를 요청하고, 엔지니어가 리뷰를 마치면 패치가 정식으로 채택됨

◾ 페이스북은 디버깅뿐 아니라 이미 코드의 빌드와 배포까지 자동화하고 있는데, 이런 자동화 시스템이 필요한 것은 페이스북에서 매주 10만 건의 소스 코드 수정이 발생하기 때문

▸ 페이스북은 자체 개발하여 2011년에 OSS로 공개한 CI(지속적 통합) 도구 ‘Phabricator(패브리케이터)’를 사용해 코드의 빌드, 테스트 및 배포를 자동화 하고 있는데, 사람과 마찬가지로 AI도 패브리케이터를 이용해 개발 워크플로우를 자동화 하고 있음

▸ 페이스북이 디버깅을 자동화하는 것은 지속적 배포(CD)를 실행하는 기업으로서 매일 놀라운 속도로 소프트웨어를 변경해야 하고 따라서 방대한 테스트가 필요하기 때문임

▸ @Scale Conference에서 페이스북이 공개한 바에 따르면, 페이스북에서는 매주 소스 코드에 대한 커밋(1회의 코드 추가 및 수정 내역)이 약 10만 회 발생한다고 함

▸ 물론 버그 수정 횟수가 많고 페이스북이 이를 자동화 하려고 생각한 것은 버그의 원인이 단순하기 때문이기도 한데, 사피엔즈가 발견한 안드로이드용 페이스북 앱의 충돌 원인 중 가장 많은 것은 ‘NULL 포인터 참조 오류’라고 함

◾ 한편 페이스북의 디버깅 자동화 시스템은 신기술을 개발한 학계와 대규모 컴퓨팅 자원을 보유한 인터넷 대기업의 협업으로 만들어졌다는 점에서 향후 컴퓨터 과학 분야의 참조가 될 만함

▸ 사피엔즈는 원래 탐색 기반 소프트웨어 엔지니어링의 고안자로 유니버시티 칼리지 런던(UCL)의 마크 하먼(Mark Harman) 교수 연구팀이 개발을 시작한 것임

<자료> Facebook

[그림 2] 사피엔즈 시스템의 자동 테스트 기술 레벨

▸ 페이스북은 2017년 1월, 하먼 교수 연구팀 중 일부가 UCL에서 스핀아웃하여 설립한 스타트업 ‘매직(MaJiCKe)’을 인수했는데, 매직의 멤버 전원이 페이스북으로 이적했고 사피엔즈에 이어 샙픽스 개발에도 참여했다고 함

▸ UCL에서 개발하던 당시 사피엔즈는 테스트 환경으로 실제 안드로이드 스마트폰을 사용했는데, 연구팀은 페이스북으로 옮긴 뒤 방대한 스마트폰 시뮬레이터 환경인 ‘원 월드’를 이용할 수 있게 되었고 테스트 환경이 단숨에 대형화 되며 실질적 성과를 낼 수 있게 되었음

▸ 학계의 연구자가 대학에 없는 빅데이터와 거대 컴퓨터 자원을 찾아 대형 인터넷 기업으로 옮겨가려는 움직임은 지금까지는 주로 기계학습 등에서 두드러졌는데, 사피엔즈 사례는 향후 소프트웨어 공학 등 컴퓨터 과학의 전 분야에서 유사한 움직임이 일어날 가능성을 시사함

저작자표시 비영리 동일조건

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

IBM 100만 명 얼굴 정보 담은 데이터셋 공개, 인식의 공정성이 목표 (0)	2019.04.18
페이스북, 사진의 특정 부분을 터치하면 AI가 상황을 설명해주는 서비스 (0)	2018.11.28
웨더뉴스-엔비디아, AI 이용한 전세계 강우 상황 가시화 프로젝트 (0)	2018.09.28
싱가포르 정부,‘AI 거버넌스 프레임워크’ 구축의 방법론 제시 (0)	2018.09.12
전세계 디지털 혁신 공급망을 꿈꾸는 캐나다의 AI 수퍼클러스터 (0)	2018.08.31

웨더뉴스-엔비디아, AI 이용한 전세계 강우 상황 가시화 프로젝트

주간기술동향 최신ICT이슈/인공지능(AI) 2018. 9. 28. 20:51 Posted by Purple Frog

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1865호(2018. 9. 26. 발행)에 기고한 원고입니다.

▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

웨더뉴스-엔비디아, AI 이용한 전세계 강우 상황 가시화 프로젝트.pdf

◾ 웨더뉴스(Weathernews)는 최근 엔비디아(NVIDIA)와 협력하여 전세계 강우 상황을 AI(인공 지능)로 가시화하는 프로젝트를 시작한다고 발표

▸ 전지구적 차원의 기후 변화 영향으로 최근 세계 곳곳에서 자연 재해가 빈발하고 있는데, 동남아시아 지역 등 비가 많이 내림에도 불구하고 기상 관측 인프라가 아직 정비되어 있지 않고 기상 전문 인력도 부족한 지역이 많음

▸ 기상 상황 파악과 예측 능력이 자연재해 빈발 흐름에 제대로 대응할 수 없는 것인데, 이에 따라 자연히 피해가 선진국에 비해 커지기가 쉬움

▸ 웨더뉴스의 프로젝트는 이런 문제를 겪고 있는 국가를 지원하기 위한 것으로, 엔비디아가 보유한 딥러닝 기술을 이용하여 강수 분포를 가시화하고 강우를 예측하여 호우 피해 경감에 기여할 것을 목표를 하고 있음

▸ 이번 프로젝트는 엔비디아의 딥러닝 전용 수퍼 컴퓨터 ‘DGX-1’을 이용하게 되는데, 높은 정확도의 위성 이미지와 비구름 레이더 이미지를 학습 데이터로 이용하여 훈련시킨 후, 실시간 위성 이미지에서 가상의 비구름 레이더 이미지를 생성시킨다는 계획

<자료> xTech

[그림 1] 딥러닝으로 생성한 가상의 비구름 영상

▸ 엔비디아는 GPU 컴퓨팅을 위한 하드웨어와 소프트웨어를 제공하게 되며, 엔비디아의 스타트업 지원 프로그램에 참여하고 있는 ‘드에이아이그노시스(dAignosis)’가 DGX-1 기반 딥러닝을 개발하고, 웨더뉴스가 새로운 기상모델을 개발하게 됨

◾ 현재 기상 레이더로 관측할 수 있는 지역은 전지구 표면적의 17%에 불과한데, 이번 프로젝트는 낮은 비용으로 전지구를 관측할 수 있는 가능성을 제시한다는 점에 의의가 있음

▸ 관측 지역의 지구의 17%에 불과하다는 것은 선진국 이외 지역은 관측이 제대로 되지 않는다는 뜻인데, 지구 전체를 커버하려면 4,000 개의 기상 레이더가 필요하다고 함

▸ 이에 비해 DGX-1 수퍼컴퓨터를 50대 이용하면 ‘가상 레이더’로 전세계 기상 데이터를 1분마다 생성할 수 있게 된다고 하는데, AI를 이용한 가상 레이더 구축비용은 4천 개의 기상 레이더를 운용하는 비용의 8,000분의 1 수준으로 추정

저작자표시 비영리 동일조건

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

페이스북, 사진의 특정 부분을 터치하면 AI가 상황을 설명해주는 서비스 (0)	2018.11.28
페이스북, AI로 소프트웨어 버그 수정하는 SapFix 시스템 공개 (0)	2018.11.14
싱가포르 정부,‘AI 거버넌스 프레임워크’ 구축의 방법론 제시 (0)	2018.09.12
전세계 디지털 혁신 공급망을 꿈꾸는 캐나다의 AI 수퍼클러스터 (0)	2018.08.31
페이스북, 실생활에서 상식을 익히고 사람의 말을 이해하는 AI 개발 (0)	2018.08.23

싱가포르 정부,‘AI 거버넌스 프레임워크’ 구축의 방법론 제시

주간기술동향 최신ICT이슈/인공지능(AI) 2018. 9. 12. 16:58 Posted by Purple Frog

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1862호(2018. 9. 5. 발행)에 기고한 원고입니다.

▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

싱가포르 정부,‘AI 거버넌스 프레임워크’ 구축의 방법론 제시.pdf

[ 요 약 ]

지금까지 발표된 AI 개발의 윤리와 거버넌스에 관한 보고서는 대부분 어떤 ‘가치(What)’가 중요한가라는 관점에서 전세계적으로 공유할 원칙을 정의하는데 초점이 있었음. 이에 비해 싱가포르 정부가 발표한 ‘AI 거버넌스 및 윤리 정책’은 그렇게 정의한 원칙을 공유한 다음 각 기업과 산업단체가 ‘어떻게(How)’ 자율적으로 거버넌스를 구축할 지에 관한 실천적 프레임워크를 제시하고 있어 AI 거버넌스를 고민하는 나라들에 좋은 참고가 될 전망

[ 본 문 ]

◾ 2018년 6월 싱가포르 정부가 발표한 ‘AI 거버넌스 및 윤리 정책’ 계획은 싱가포르와 관련된 AI의 윤리와 혁신에 관련한 전세계 기업들의 정책 수립에도 좋은 참조가 될 전망

▸ ‘Artificial Intelligence Governance and Ethics Initiatives'라는 제목의 이 계획은 혁신 친화적인 규제와 AI 이용자가 신뢰할 수 있는 환경의 구축을 목표로 각 산업 분야와 기업이 AI 개발과 관련한 자발적인 규칙을 제정할 것을 요청하고 있음

▸ 싱가포르 정부의 계획은 지금까지 각국 정부가 발표한 유사한 보고서와 확연히 구별되는데, 기업이 AI 시스템을 개발하는 데 ‘어떤(WHAT)’ 가치를 지킬 것인가에 더해, 어떻게(HOW) 지켜야 할 것인지에 대해 심도 있게 파고 드어 기술하고 있기 때문

▸ 따라서 이 계획은 비단 싱가포르와 비즈니스를 전개하는 외국 기업들에 영향을 미칠 뿐만 아니라, 우리나라를 포함 각국의 기업들이 ‘AI의 윤리’를 고려하면서도 혁신을 촉진하는 틀을 만드는 데 유용한 참조가 될 가능성이 있음

◾ 지금까지 여러 국가에서 공개된 AI의 윤리와 거버넌스에 관한 보고서는 ‘무엇이 중요한 질문인가’라는 관점에서 전세계가 공유할 ‘원칙’을 정리하는데 초점을 두고 있음

▸ 현재 미국의 백악관, 영국 하원 과학 기술위원회, 프랑스 의회, 일본 총무성 산하 정보통신정책연구소 등이 AI의 윤리와 거버넌스에 관한 원칙과 지침을 책정하고 있음

▸ 정부뿐 아니라, 미국 전자전기학회(IEEE), 비영리법인인 생명의 미래(Future of Life Institute), 구글, IBM, 페이스북 등 기업이 조직한 ‘AI 파트너십(Artificial Intelligence Governance and Ethics Initiatives)’ 등 다양한 산학연 기관이 AI의 윤리와 거버넌스를 고려할 때 원칙과 논점을 제정하고 있음

▸ 우리나라의 경우 2017년 10월에 과학기술정보통신부와 한국정보화진흥원·정보문화포럼이 ‘지능정보사회 법제도 포럼’을 출범시키고 지능정보사회의 윤리 가이드라인 마련작업을 시작한다고 발표한 바 있음

▸ 당시 포럼은 인간 중심의 지능정보사회 구현을 목표로 이해관계자의 의견을 수렴해 개발자·공급자·이용자 대상 윤리 가이드라인을 2017년 연내 확정한다는 방침이었음

▸ 그러나 이후 과학기술정보통신부는 입장을 바꿔, 국내 AI 관련 산업은 아직 초기 단계여서 정부가 나서 가이드라인을 만들 상황이 아니기 때문에, 민간부문과 상의해 보편적 수준의 신기술 연구 가이드라인을 만든다는 쪽으로 계획을 변경하였음

▸ 지금까지 발표된 수많은 보고서의 공통점은 AI와 윤리를 고려함에 있어 ‘무엇이 중요한 질문이며, 가치인가’, 즉 ‘WHAT’의 관점에서 전세계적으로 공유할 수 있는 원칙을 정리하고 목록화했다는 것임

▸ 세계 곳곳에서 지난 2년여 동안 논의가 전개된 결과‘WHAT’에 대한 논점은 이미 도출되었으며, 현재 그 다음 단계로 요구되고 있는 것은 AI를 이용한 기술과 서비스를 제공하는 개발자와 기업이 그 원칙을 어떻게 구현해야 하는가라는 ‘HOW’에 대한 논의임

◾ 싱가포르 정부가 제시한 이번 계획은 HOW에 천착한 것으로, 각 산업 분야와 기업이 다양한 가치를 자율적으로 취사선택하는 실천적인 거버넌스 프레임워크를 제시하고 있음

▸ 싱가포르 정부는 이 계획을 수립하기 위해 한국에서 가이드라인 마련 계획을 발표했던 것과 같은 시기인 2017년 10월부터 AI 거버넌스 관련 부처들의 전체 회의를 시작하였음

▸ 참여 부처들은 다방면에 걸쳐 있는데, 사업 개발의 중심이 된 ‘IMDA’는 싱가포르 정보 통신부의 구체적인 정책을 수립·실행하는 법정 위원회임

▸ 또한 IMDA 산하의 개인정보보호위원회(PDCD)와 싱가포르 금융관리국(MAS), 육상교통청(LTA), 검찰청, 싱가포르 경쟁 및 소비자 위원회(CCCS) 등 각 부문의 규제 및 감독 기관들이 함께 참여하였음

▸ 그 밖에도 보건부(MOH), 정보통신부(MCI), 총리실 직속의 ‘스마트 국가와 디지털 거버넌스 오피스(SNDGO)’, 정부기술청(Gov Tech), 전략적 미래 센터(CSF), 부처 횡단으로 추진되고 있는 인공지능 관련 5개년 계획인 ‘AI 싱가포르’ 등도 참여

◾ 싱가포르의 여러 부처들이 한 데 모여 약 8개월간의 논의를 거친 끝에 올해 6월 ‘AI 거버넌스 및 윤리 정책’ 계획이 공개된 것이며, 3가지 주요 내용을 담고 있음

Discussion-Paper-on-AI-and-PD-Personal-Data-Protection-Commission-Singapore.pdf

▸ 주요 내용 3가지는 (1) 소비자와 고객의 신뢰를 얻고 혁신을 추진하기 위한 논점을 정리 한 ‘토론 논문(discussion paper)'을 공개

<자료> PDPC of Singapore

[그림 1] AI 거버넌스의 논점을 정리한 토론 논문

▸ (2) 각 산업 분야의 업계 단체나 소비자 단체의 리더들이 자율적 규칙 만들기를 위해 대화하는 ‘AI와 데이터의 윤리적 사용’ 자문위원회를 설치

▸ (3) AI와 데이터 이용의 거버넌스에 관한 연구 프로그램을 싱가포르 경영 대학(SMU)에 5년간 설치한다는 것임

▸ 이에 따라 싱가포르 정부는 계획을 발표하며, (1)의 내용에 해당하는 ’인공지능과 개인 데이터에 관한 토론 논문: 인공지능의 책임 있는 개발과 수용의 조성(Discussion Paper On Intelligence and Personal Data-Fostering Responsible Development and Adoption of AI)'도 함께 공개하였음

▸ 계획의 핵심은 산업계에 AI에 대한 자율 규제의 프레임워크를 제정하도록 촉구하는 것이며, 토론 논문은 이를 위한 논점을 정리한 것으로 총 16페이지, 5장으로 구성되어 있음

▸ 이 토론 논문은 2018년 6월 공개된 이후 싱가포르의 여러 부처 및 업계 단체에 배포되었고, PDPC의 웹사이트에서도 볼 수 있으며, 현재 피드백을 수렴하고 있음

◾ 토론 논문의 제1장 ‘도입(Introduction)' 파트는 민간 기업이나 업계 단체에 대해 자발적인 행동 기준을 포함한 거버넌스 프레임워크를 제정하라는 요구를 명확히 하고 있음

▸ 도입부는 규제를 제정하는 감독 기관, AI 개발자와 서비스를 제공하는 기업, 나아가 소비자 등 이해관계자 사이에서 ‘어떤 거버넌스가 필요한가’에 대해 대화하는 것이 중요하다고 지적하는데, 이 때 중요한 관점으로 다음의 세 가지를 제시하였음

▸ ① 거버넌스 프레임워크는 특정 AI 기술에 국한되지 않는 기술 중립적인 것으로서, 엄격한 관리체계가 아님(light-touch)

▸ ② AI를 이용한 기술과 서비스를 제공하는 개발자 및 공급자가 자사의 기술과 서비스 개발에 어떤 규제(자율 행동규범도 포함)가 관련되어 있는지를 알 수 있도록 하기 위해, 규제를 제정하는 측은 규제와 규칙을 명확한 형태(regulatory clarity)로 제공해야 함

▸ ③ 최소한의 요건으로는, 설명 가능성, 투명성, 공정성, 그리고 인간중심주의를 촉진하는 원칙과 규칙을 제정함으로써 기술 개발에 대한 소비자의 신뢰를 획득함

▸ 이 밖에도 도입부에서는, 이해관계자에 속하는 ‘AI 개발자’, ‘사용자 기업’, ‘소비자와 고객’에 대해 정의하고 있으며, AI를 실행하는 데는 ‘데이터 처리’, ‘알고리즘에 의한 분석’, ‘모델 선택’ 등의 단계가 있음을 설명하고 있음

◾ 이어 제2장은 거버넌스 프레임워크의 두가지 원칙, 3장은 그 원칙을 산업에 적용하기 위한 전제, 4장은 거버넌스 프레임워크의 작동 방식, 5장은 향후 과제에 대한 내용을 담고 있음

▸ 2장에서 제시된 거버넌스 프레임워크의 두 가지 원칙은 ‘투명성’과 ‘인간중심성’인데, 규칙을 제정할 때는 이 원칙을 규제기관, 협회, 기업, 소비자 단체 등이 공유하는 것이 중요하므로 자문위원회 같은 대화의 장을 마련할 것을 권고하고 있음

▸ 3장에서는 두 원칙을 개별 산업 분야에 적용할 때 ‘기술중립성’과 ‘최소 기준’이라는 두 가지 전제와 ‘법적 책임성’이라는 한계를 반드시 고려해야 함을 기술하고 있음

▸ 3장까지가 왜(WHY) 거버넌스가 필요하고, 어떤(WHAT) 논점이 있는지를 정리한 것이라면, 제4장은 거버넌스 프레임워크가 어떻게(HOW) 규칙을 만드는지 그 방법을 4단계로 보여주고 있음

▸ 마지막 5장의 제목은 ‘다음 단계(Next Step)’로, 본 논문의 목적이 토론을 촉진하기 위한 것이기 때문에 많은 조직이 이 프레임워크를 이용해 논의할 것을 권고하고 있음

[표 1] 싱가포르 정부가 제시한 ‘AI 거버넌스 프레임워크’의 4단계 규칙 제정 프로세스

단계	주요 내용
제2장 “책임 있는 AI를 위한 원칙”	제1원칙	AI에 의해 또는 AI의 지원에 의해 내려진 결정은 설명 가능해야 하며 투명하고 공정해야 함
제2장 “책임 있는 AI를 위한 원칙”	제2원칙	AI 시스템, 로봇과 AI에 의해 내려진 결정은 인간중심적이어야 함
제3장 “AI용 거버넌스 프레임워크의 탐구“	두 전제	기술중립성: 프레임워크는 기술 설계와 응용, 이용에 초점을 맞추어야 한다는 것이며 단지 AI 기술에만 적용되는 것은 아님 최소 기준: 프레임워크는 전 산업 분야에 걸친 최소한의 기준으로 적용되는 것이며, 특정 산업 분야 및 산업 단체에는 더욱 강한 기준이 추가로 부과될 수 있음
제3장 “AI용 거버넌스 프레임워크의 탐구“	한계	법적 구속력: 프레임워크가 법적 책임과 손해배상 등 구체적인 내용을 결정하는 것은 아님
제4장 “거버넌스 프레임워크의 4단계“	1단계	AI 거버넌스 프레임워크의 목적을 명확히 규정- 프레임워크가 내거는 목표로 ‘설명 가능성과 검증 가능성’, ‘데이터 설명 책임의 실천’, ‘투명성’ 등을 들고 있음- 그러나 프레임워크의 목표는 기업이나 산업 단체가 각자 자율적으 로 선택해야 한다고 권고
	2단계	적절한 조직적 거버넌스 대책의 선택- ‘거버넌스의 구조에 의한 대책’으로는 다음 3가지를 예시 ① 감시 기구를 도입하는 등 내부 거버넌스 구조를 구축 ② 리스크 영향 평가를 실시하고 위험 줄이기 ③ AI 개발 부서의 결정에 대해 정기적으로 또는 불시에 조사- ‘운영 관리 및 시스템 설계에 의한 대책’으로는 다음 4가지를 예시 ① 기록을 남겨 데이터에 대한 설명 책임을 완수 ② 모델의 재현성을 높게 유지함으로써 신뢰성을 획득 ③ 의사 결정에 대한 추적 가능성을 제고 ④ 데이터와 모델을 정기적으로 튜닝하여 적절히 변경- 이상의 대책은 ‘반드시 해야 하는 체크리스트’가 아니며, 이용하 는 기술이나 적용하는 산업 부문 등에 따라 필요한 조치를 취사선 택해야 함
	3단계	고객/소비자 관련 관리 프로세스를 고려- 고객과 소비자의 신뢰를 얻기 위해 필요한 대책으로 다음 3가지를 예시 ① 적극적으로 정보를 공개하고 설명하는 '투명성’ ② 휴리스틱 평가를 통해 사용성에 관한 문제점을 밝혀내고 사용자 가 데이터 이용에 대해 ‘옵트인/옵트아웃’ 할 수 있는 선택권 을 제시하는 ‘쌍방향성’ ③ 소비자로부터 피드백을 얻을 수 있도록 하고 자율적 의사결정에 대해 소비자가 평가 할 수 있도록 하는 ‘커뮤니케이션’- 이상의 대책 역시 ‘반드시 해야 하는 것’이 아니며 필요하다고 생각하는 조치를 기업 및 산업단체가 선택해야 함
	4단계	의사 결정과 위험 평가를 프레임워크에 통합- AI 시스템의 사용을 통해 소비자와 고객이 손해를 입게 될 위험성 이 있는 경우 그 리스크의 평가 방법으로 ‘위험의 크기와 확률에 따른 매트릭스’ 등을 예로 제시- 위험의 크기와 종류에 따라 AI를 사용하는 시스템의 의사 결정에 인간이 얼마나 관여해야 할 지가 달라지게 됨- 가령 의료 행위처럼 손해의 크기와 그 발생 확률이 모두 큰 경우, ‘인간이 최종 결정을 담당하는 접근 방식(Human-in-the-loop)’이 나은 것으로 간주됨. 이 경우 기업은 재현성 및 추적 가능성에 초 점을 맞춘 대책 마련이 필요(제2단계)- 반면, AI가 자동으로 결정을 내리지 않고 인간이 최종적으로 판단 하는 경우 고객에게 AI의 내부 프로세스에 대한 정보를 제공할 필 요는 없음(제3 단계)
<자료> PDPC of Singapore, IITP 정리

◾ 이러한 틀이 제대로 작동하게 하려면 민간 기업의 자발적 규정 마련과 법적 규제, 이 양축이 역할을 잘 분담하는 것이 중요함

▸ 실제로 유럽연합이 일반데이터보호규칙(GDPR)을 2018년 5월부터 시행한 바도 있어, 싱가포르는 현재 국제적인 틀과 보조를 맞추는 위해 개인정보보호법의 개정 등을 위한 작업이 진행 중에 있음

▸ 이번 계획 발표 이후에도 금융, 교통, 의료 등 각 산업 특유의 아젠다에 대해서는 회의 참석 주체인 관할 부처들이 계속 논의를 진행할 전망

▸ 가령 싱가포르 금융 관리국(MAS)은 이미 금융업이 AI와 데이터 분석을 활용하는데 필요한 책임 있는 윤리적 이용 가이드라인을 만들기 위한 논의를 시작하고 있음

▸ 한편 본 토론 논문의 내용 범위는 어디까지나 ‘비즈니스’에 국한된 것이며, ‘국방(Defense)’은 포함하지 않기로 제1차 회의에서 합의한 것으로 알려졌음

◾ 토론 논문이 기업의 자발적 규칙 마련을 촉구하고 있지만, 4장에 설명된 대로 일률적으로 체크리스트화 하는 것은 아니며 각 기업이 필요한 규칙을 선택하도록 권고하고 있음

▸ 이를 통해 각 기업과 산업의 규모에 따라 가능한 범위에서 대책을 강구함으로써, 스타트업을 중심으로 한 혁신을 저해하지 않고 AI 관련 사업을 키워 나갈 것을 기대하는 것임

▸ 각 업계 단체와 기업은 AI 기술을 사용한 시스템과 서비스를 개발할 때, 본 논문을 참조해 어떤 가치를 중요시하고, 누구에게 어떤 대책을 실시해야 하는지, 또는 하지 않아도 좋은 것은 무엇인지를 스스로 판단에 의해 결정해야 한다는 것임▸ 예를 들어 본 논문에는 무엇이 ‘손해’에 해당하는 지를 구체적으로 기술하지 않고 있으며, 기업 스스로 자발적으로 정의하고 조치를 취할 것을 요구하고 있음

<자료> ITPro

[그림 2] 위험의 크기와 확률 매트릭스

▸ 나아가 논문에서 제시된 프레임워크 자체도 하나의 예이자 프로토타입일 수 있는데, 가령 프레임워크 작동의 4단계에서는 위험 평가의 영향과 확률 이외에도 비용 및 리소스 등을 평가 기준에 넣는 것이 가능함

▸ 핵심 요지는 “중요하게 생각하는 목표를 설정하고(1단계), 적절한 프로세스를 통해 대책을 강구하며(2단계), 고객에게 미치는 영향도 고려하되(3단계), 구체적인 위험 평가를 실시한다(4단계)”는 프레임워크를 견지하며 판단해야 한다는 것임

▸ 즉 각 단계에서 무엇을 중시할 지는 업계 단체나 기업이 자발적으로 궁리하되, 대내외적으로 설명할 수 있는 확실한 나름의 근거와 프로세스를 마련해야 한다는 것임

◾ 싱가포르 정부의 ‘AI 거버넌스 구조’는 표준을 제정해 지침으로 내리는 하향식이 아니라, 가치 공유 이후 기업이 자율적으로 제정하는 상향식 접근을 제시한다는 것이 특징

▸ 서두에 언급한 것처럼 싱가포르 정부가 공개한 논문이 보여준 거버넌스의 구조는 AI에 대한 '원칙'과 '지침'을 제시하는 기존의 보고서와 사뭇 다른 양상을 띠고 있음

▸ 지금까지의 보고서의 목적은 대부분 전세계적으로 공유할 수 있는 원칙과 논점을 제시하는 것이었으며, 그 논점이 특정 이해관계자의 관점에 치우치지 않도록 하려다 보니 이해관계자의 다양성이 중요했음

▸ 가령 IEEE의 ‘윤리적으로 조화된 설계’ 보고서는 250명 이상이 참여해 만들어졌는데, 추상적인 논의에 빠지지 않겠다는 취지하에 의료, 교통, 군사 등 개별 분야의 사례와 문헌을 수시로 소개하고 있음

▸ 물론 기존에도 AI 연구 개발 및 기술 설계를 진행하는데 있어 어떻게 거버넌스 구조를 만들 것인가에 대한 논의도 있었으나, 거버넌스 구축 방법을 표준으로 제정하는 접근방식을 취했으며, 대표적인 것이 IEEE-SA 표준 규격임

▸ 이에 비해 싱가포르 정부는 똑같이 HOW에 관해 논의하고 있더라도 정부가 표준을 만든다는 하향식 접근이 아니라 무엇이 최소한 지켜야 할 가치인가(WHAT)를 공유한 다음, 구체적으로 그것을 지켜나가는 방법에 관해서는 각 업계 단체와 기업이 취사선택을 하여 자율적으로 규칙을 만드는 상향식 접근 방식을 제시하고 있음

▸ 또한 지금까지 AI 관련 기술과 시스템 개발에서 자율적으로 규칙을 제정하려는 논의가 개별 산업단체 및 기업 차원에서 시도된 것에 비해, 싱가포르 정부는 AI에 관련된 모든 산업 분야에 걸쳐 정부와 산업계 및 소비자 단체 등의 지식인으로 구성된 자문위원회를 설치하고 있다는 점도 특징임

◾ 우리나라를 포함해 전세계적으로 AI 거버넌스와 윤리에 대한 프레임워크 제정의 필요성이 높아지고 있는 가운데, 싱가포르의 행보는 유의미한 참조 사례로 주시할 가치가 있음

▸ 싱가포르가 추구하고 있는 관과 민의 하이브리드에 의한 AI 거버넌스 규정 제정이나, 상향식 접근방식 등은 싱가포르의 특수한 환경 때문이라 치부할 수도 있음

▸ 실제 싱가포르는 서울시 한 구 크기의 도시 국가로 인구는 560만 명 정도에 불과하며, 일당 체제로서 정책 결정이 빠르고, 고려해야 할 이해관계자의 수가 다른 나라에 비해 많지 않다는 점 때문에 가능한 전략일 수도 있음

▸ 그러나 WHAT에 초점을 맞추어 다양한 이해관계자의 관점에서 논점을 정리해 열거한 두꺼운 보고서와 비교하면, 구체적인 HOW의 논의로 전환하여 민간 기업의 자유를 존중하면서 AI를 적절하게 통제하고 자국 산업의 발전을 촉진하려는 싱가포르의 노력은 실질적이고 합리적이며 행보가 가벼운 것으로 보임

▸ 물론 완전한 정부 주도도 아니고 완전히 민간에 맡기는 것도 아닌, 민관이 공동으로 고민해 가는 싱가포르식 ‘거버넌스 프레임워크’가 실제로 어떤 결과를 나을 지는 아지 알 수 없으며 지켜보아야 함

▸ 프레임워크가 어떻게 작동하는지, 기업·산업별 재량에 따라 해석의 유연성의 차이나 실제 효력이 어떻게 구축되고 조정되어 가는지 등은 실제로 구조가 작동되기 전에는 알 수 없는 부분이 많기 때문

▸ 그러나 싱가포르가 AI 거버넌스 프레임워크와 관련해 새로운 관점과 방식을 제시한 것은 사실이며, 싱가포르의 노력으로부터 무엇을 배울 것인지를 식별하기 위해서라도 싱가포르의 향후 행보를 계속 주시할 필요가 있을 것임

저작자표시 비영리 동일조건

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

페이스북, AI로 소프트웨어 버그 수정하는 SapFix 시스템 공개 (0)	2018.11.14
웨더뉴스-엔비디아, AI 이용한 전세계 강우 상황 가시화 프로젝트 (0)	2018.09.28
전세계 디지털 혁신 공급망을 꿈꾸는 캐나다의 AI 수퍼클러스터 (0)	2018.08.31
페이스북, 실생활에서 상식을 익히고 사람의 말을 이해하는 AI 개발 (0)	2018.08.23
구글 ‘콜센터 AI’ 서비스 발표, 상담원과 AI의 협업 솔루션 강조 (0)	2018.08.17

전세계 디지털 혁신 공급망을 꿈꾸는 캐나다의 AI 수퍼클러스터

주간기술동향 최신ICT이슈/인공지능(AI) 2018. 8. 31. 10:57 Posted by Purple Frog

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1861호(2018. 8. 29. 발행)에 기고한 원고입니다.

▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

전세계 디지털 혁신 공급망을 꿈꾸는 캐나다의 AI 수퍼클러스터.pdf

[ 요 약 ]

AI(인공지능)의 겨울 시대에도 연구개발 투자를 지속하여 세계 최고 수준의 AI 연구자들을 배출해온 캐나다는 AI가 모든 산업의 디지털 혁신을 촉진하는 기반이 된다는 비전 아래, 산학관이 협력하여 AI 인재 육성과 AI 스타트업 지원, AI 연구 기반 조성에 주력하고 있음. 토론토, 몬트리올, 애드먼튼을 비롯한 여러 도시에 세계 최고의 AI 수퍼클러스터를 구축한 캐나다는 글로벌 ICT 기업들이 AI 연구거점은 물론 글로벌 AI 인재들도 끌어 모으고 있음

[ 본 문 ]

◾ AI(인공지능) 연구개발의 겨울 시기로 불렸던 1990년대부터 AI에 대한 투자를 지속해 온 캐나다에는 이미 세계 유수의 AI 스타트업들이 몰려들고 있음

▸ 캐나다는 AI를 생명과학과 항공우주 산업을 비롯, 모든 제조업에 엄청난 충격을 가져다 줄 새로운 산업 플랫폼으로 보고, 토론토, 몬트리올, 에드먼튼 등 3개 도시에 세계적인 AI 수퍼클러스터를 구축해 전세계의 우수한 인재를 유치하고 있음

▸ 몬트리올 소재 AI 연구소인 ‘엘리먼트 AI(Element AI)’가 올해 5월에 발표한 ‘캐나다 인공지능 생태계(Canadian AI Ecosystem) 2018’ 보고서에 따르면 캐나다에는 650개의 AI 스타트업이 있으며, 이는 2017년에 비해 28% 증가한 것

Canadian+AI+ecosystem+2018.pdf

▸ 캐나다의 강점은 ‘AI의 겨울’로 불렸던 1990~2000년대에도 쉬지 않고 AI에 투자를 해온 것으로, 토론토, 몬트리올, 에드먼튼에는 딥러닝과 강화 학습을 발전시켜 온 대학 및 연구기관과 우수한 AI 연구자가 다수 존재함

<자료> Element AI

[그림 1] 2018 캐나다의 인공지능 산업 생태계

◾ 캐나다의 AI 3대 도시 중 토론토와 몬트리올은 심층학습 연구의 세계적인 중심지이며, 에드먼튼은 2천 년대부터 강화학습의 연구에 주력해 오고 있음

▸ 현재 딥러닝 기술의 융성은 토론토 대학의 제프리 힌튼(Geoffrey Hinton) 교수와 몬트리올 대학의 요슈아 벤지오(Yoshua Bengio) 교수, 그리고 힌튼의 제자인 얀 르쿤(Yann LeCun) 박사 등 3명에서 비롯되었음

▸ 이들은 2004년 캐나다 첨단연구기구(CIFAR, Canadian Institute for Advanced Research)에서 신경망 연구 프로젝트인 ‘Neural Computation & Adaptive Perception(NCAP, 신경 컴퓨팅과 적응형 지각)’을 시작하였음

▸ 딥러닝이라는 개념도 힌튼이 2006년 발표한 논문에서 비롯되었는데, 이후 토론토와 몬트리올은 딥러닝 연구의 세계적인 중심지가 되었음

▸ 에드먼튼에는 2000년대부터 강화학습의 연구에 주력해 온 앨버타 대학이 있는데, 심층 강화학습으로 알파고를 개발한 딥마인드(DeepMind)에는 창업 초기부터 앨버타 대학에서 강화학습을 배운 연구원 12명이 참가하기도 하였음

◾ 캐나다의 전략은 토론토, 몬트리올, 에드먼튼의 대학이나 연구 기관에 전세계에서 인재를 모으고 이들이 계속 캐나다에 남아 활동하도록 전폭적인 지원을 하는 것임

▸ 캐나다가 3대 도시에 AI 인재의 수퍼클러스터를 형성시킨 것은 전세계에서 모여든 우수한 인력을 AI 인재로 육성한 후 이들이 자국으로 돌아가거나 미국으로 가는 것이 아니라 캐나다에 계속 머물도록 하기 위해서임

▸ 이를 위해 캐나다는 AI 인재를 잡아두기 위해 AI 스타트업 지원을 강화하는 외에 AI 인재들이 활약할 수 있는 장을 마련하기 위해 국내외 유력 기업의 AI 연구개발(R&D) 거점 및 비즈니스 거점을 유치하는 데 총력을 기울이고 있음

▸ 3대 도시의 AI 수퍼클러스터는 캐나다 기업들에 AI 기술과 AI 인재를 제공하는 원천, 즉 AI의 공급망(supply chain)이 되며, AI 공급망은 캐나다 기업들이 디지털 혁신을 추진하는 데 매우 강력한 무기가 됨

▸ 캐나다 정부가 AI 진흥을 추진하는 목적은 단순히 AI 스타트업의 육성에 있는 것이 아니며, 캐나다 기업의 디지털 혁신을 촉진하여 국가 산업 전체를 레벨업 하기 위한 것임

◾ 토론토, 몬트리올, 에드먼튼의 AI 수퍼클러스터는 ‘유력 대학, 산학협력 연구소, 스타트업 지원기관’의 3개 기둥이 받치고 있으며 캐나다 정부와 지자체의 지원 하에 정비되어 있음

▸ 수퍼클러스터를 떠받치는 3대 요소는 (1) AI 연구를 실행하는 유력 대학, (2) 유력 대학과 산업계가 연계하여 AI 인재를 육성하는 NPO(비영리단체) AI 연구소, (3) 대학 및 AI 연구소가 배출한 AI 인재의 창업을 지원하는 스타트업 액셀러레이터임

▸ 가령 토론토의 경우 토론토 대학 외에 토론토에서 100 킬로미터 거리에 있는 워털루 대학, 요크 대학 등이 AI 연구 및 AI 인재 육성에 힘을 쏟고 있으며, 산학 연계의 AI 연구 기관으로는 2017년에 발족한 벡터 연구소(Vector Institute)가 있음

▸ 토론토 대학의 힌튼이 수석 과학고문을 맡고 있는 벡터 연구소는 온타리오 정부가 5천만 캐나다 달러를 지원하고, 구글, 액센츄어, 우버 등 민간기업 30개 사가 8천만 달러를 투자하여 설립되었음

▸ 벡터 연구소는 AI 연구를 수행할 뿐만 아니라 이미 대학을 졸업한 엔지니어와 연구자에 대한 AI 교육도 실시하는데, 벡터 연구소가 올해 여름에 개최하는 섬머 스쿨에는 270명이 참가하여 AI에 대한 교육을 이수하였음

▸ AI 스타트업을 육성하는 기관으로는 토론토 대학에 인접한 MaRS 디스커버리․디스트릭트 (MaRS Discovery District)와 토론토 인근의 마크햄에 있는 벤처랩(ventureLAB) 등이 있음

▸ 이처럼 AI 연구, AI 인재 육성, AI 스타트업 육성 기관 등이 모두 토론토 주변에 몰려 있는 환경을 구축함으로써 ‘토론토 AI 클러스터’를 지탱하고 있는 것이며, 이는 몬트리올과 에드먼튼의 클러스터도 마찬가지

[표 1] 캐나다 3개 도시의 AI 수퍼클러스터 및 주요 참여기관

참여 기관	토론토	몬트리올	에드먼튼
(1) AI 연구를 수행하는 유명 대학	토론토 대학, 워털루 대학, 요크 대학	몬트리올 대학, 맥길 대학	앨버타 대학
(2) AI 인재 육성 산학협력 연구소	벡터 연구소	MILA	AMII
(3) AI 스타트업 액셀러레이터	MaRS 디스커버리․디스트릭트, 벤처랩	엘리먼트 AI, 탠덤론치	스타트업 에드먼튼
<자료> ITPro, Jul 2018

◾ 캐나다 정부는 클러스터의 3대 기둥 중에서도 특히 AI 연구소에 국가 차원의 지원 전략을 수립하고 대규모 자금 지원을 하고 있음

▸ 토론토의 벡터 연구소, 몬트리올의 몬트리올 학습 알고리즘 연구소(Montreal Institute for Learning Algorithms, MILA), 에드먼튼의 앨버타 기계 지능 연구소(Alberta Machine Intelligence Institute, AMII) 등 3개 연구소는 캐나다 정부로부터 두둑한 지원도 받고 있음

▸ 캐나다 정부는 2017년 3월, ‘범 캐나다 인공지능 전략(Pan-Canadian Artificial Intelligence Strategy)’을 수립하고 CIFAR을 통해 벡터 연구소, MILA, AMII 등 3개 연구소에 1억 2,500 만 달러의 자금을 투자한다고 발표한 바 있음

▸ 이어 캐나다 정부는 올해 2월 ‘혁신 수퍼클러스터 전략(Innovation Superclusters Initiative)’을 발표하고, AI 스타트업을 지원하는 ‘SCALE.AI’ 조직을 설립하여 소매, 제조, 통신, 운수 등 모든 산업의 기업과 AI 스타트업을 연계하는 사업을 시작하였음

▸ 한편 캐나다 정부는 AI 수퍼클러스터 전략과 함께 해양 연구를 위한 ‘오션 수퍼클러스터’ 등 5개의 수퍼클러스터를 육성한다는 목표 하에 총 9억 5,000만 캐나다 달러를 투자할 계획임을 함께 발표하였음

▸ 대학뿐만 아니라 비영리 연구소와 AI 스타트업 액셀러레이터에 대한 지원에도 주력한다는 점과, AI 인재를 자국에서뿐 아니라 전세계에서 끌어들이려는 점이 캐나다 정부가 추진 중인 AI 국가 전략의 가장 큰 특징임

▸ 이렇게 된 데에는 미국의 상황도 영향을 미쳤는데, 이민 정책에 대해 소극적 또는 반대 입장인 트럼프 행정부가 출범한 2017년에 인도에서 캐나다로 온 유학생은 14만 명이었으며, 이는 2016년의 7만 명에 비해 두 배로 늘어난 것임

▸ 이런 유학생 AI 인재들이 캐나다에서 창업하고 혁신을 촉진하게 하는 것이 캐나다 정부의 목표인데, 캐나다의 인구는 3,600만 명에 불과하기 때문에 글로벌 경쟁력을 확보하기 위해서는 전세계에서 인재를 유치할 수밖에 없다는 것이 캐나다 정부의 판단임

◾ 한편 수퍼클러스터들의 구성이 기본적으로 비슷하긴 하나 도시별로 특색과 강점이 보이기도 하는데, 캐나다 최대의 AI 클러스터인 토론토는 AI 인재 파워가 가장 눈길을 끔

▸ 토론토 대학은 딥러닝의 대부로 불리는 제프리 힌튼 교수의 존재가 절대적인데, 힌튼 교수 문하에서 선도 기술기업의 AI 연구소를 이끄는 연구자가 여럿 배출되고 있음

▸ 페이스북의 AI 연구소를 이끄는 얀 르쿤, 애플의 AI 연구를 총괄하는 루슬란 살라쿠트디노프(Ruslan Salakhutdinov), 오픈AI(OpenAI)의 공동 설립자인 일리아 수츠케버(Ilya Sutskever) 등이 모두 힌튼 교수의 문하생임

▸ 힌튼 교수가 문하생들과 창업한 스타트업 DNN리서치(DNNresearch)는 2013년에 구글 에 인수되었으며, 구글의 AI 연구 부문인 구글 브레인과 딥마인드에는 지금도 힌튼 교수의 문하생과 토론토 대학 출신들 다수가 수석 연구원으로 재직하고 있음

▸ 수많은 주요 기술 기업들이 토론토에 AI의 연구 개발의 거점을 마련하고 있는 배경도 바로 토론토 대학과 협업하고 이 대학이 배출하는 AI 인재를 확보하기 위해서임

▸ 구글, 우버, 톰슨 로이터(Thomson Reuters) 등이 2016~17년에 AI 연구 거점을 토론토에 설치했으며, 올해 5월에는 삼성전자와 미국 3대 인터넷 쇼핑몰 중 하나인 엣시(Etsy)가, 6월에는 엔비디아가 토론토에 AI 연구 거점을 개설하겠다는 계획을 밝힌 바 있음

◾ 이런 특성을 살려 토론토가 속해 있는 온타리오 주정부는 AI 인재 육성을 가속화하는 정책을 지속적으로 설계해 실행해 오고 있음

▸ 2017년에 주정부는 온타리오의 대학에서 AI 관련 석사 학위를 취득하는 학생 수를 2023년까지 연간 1,000 명으로 늘리겠다는 계획을 발표하였음

▸ 이를 위해 토론토에 설립한 것이 바로 온타리오의 9개 대학과 40여 개 민간 기업이 협력하여 만든 AI 연구기관 ‘벡터 연구소(Vector Institute)’임

▸ 2억 300만 달러의 예산을 확보하고 있는 벡터 연구소는 20명의 상근 연구원과 100명의 박사 연구원을 보유 중인데, AI 응용 연구 수행뿐 아니라 학부 졸업생을 위한 AI 교육을 제공하거나 제휴를 맺은 타 대학을 위한 AI 인재 육성 프로그램을 개발하고 있음

▸ 올 여름에는 사회인을 대상으로 약 1개월 코스의 ‘딥러닝․강화학습 섬머 스쿨’도 개강했는데, 전세계 60개국에서 온 270명이 수강을 하였음

▸ 벡터 연구소의 수석 과학 고문으로는 힌튼 교수가 취임했으며, 연구 이사는 힌튼 교수의 문하인 리차드 제멜(Richard Zemel)이 맡고 있음

◾ AI 인재 육성과 더불어 온타리오 주정부가 전력을 쏟고 있는 것은 토론토에 글로벌 기업의 AI 연구소를 유치함과 동시에 AI 스타트업을 적극 육성하는 것임

▸ 많은 AI 연구자를 배출하고 있고 앞으로 더욱 가속화시켜 나가려는 토론토의 가장 큰 고민거리는 이렇게 육성한 AI 연구자의 대부분이 토론토를 떠나 구글, 페이스북 등 실리콘밸리 기업으로 가버리는 것임

▸ 현재 빅데이터는 대부분 실리콘밸리의 거대 기업들만 보유하고 있으며, 이는 AI 연구자를 끌어 모으는 강력한 구심력으로 작용하고 있기 때문

▸ 온타리오 주정부는 인력 유출을 최소화하기 위해 토론토에서 배운 AI 연구자들이 토론토에서 창업해 연구를 지속할 수 있는 환경을 조성하는 정책을 펴고 있음

▸ 토론토에서 AI 스타트업 육성의 중심이 되고 있는 곳은 토론토 대학에 인접한 ‘MaRS 디스커버리 디스트릭트(MaRS Discovery District)’인데, 원래 의료 스타트업 육성 시설이었으나 지금은 수많은 AI 스타트업들이 입주해 있는 시설이 되었음

▸ 벡터 연구소도 MaRS 디스커버리 디스트릭트에 입주해 있는데, 사실 이것 역시 AI 스타트업 지원사업의 일환으로, AI 연구자가 스타트업에 계속 근무하면서도 벡터 연구소에 다니며 AI 연구를 지속할 수 있도록 하기 위한 것임

▸ 딥러닝 연구는 발전 속도가 빠르기 때문에 기업에서 비즈니스 용도의 AI를 개발하더라도 최신의 AI 연구 흐름을 접해 둘 필요가 있는데, 비즈니스와 연구라는 두 마리 토끼를 한 번에 쉽게 잡게 하려는 것이 목적임

◾ 실제 힌튼 교수의 문하생들은 토론토 대학 및 벡터 연구소에 적을 유지하면서 AI 스타트업을 창업하여 AI의 비즈니스 응용이라는 목표를 실현해 나가고 있음

▸ 가령 벡터 연구소의 공동 설립자인 조던 제이콥스가 창업한 ‘레이어 6(Layer 6)’는 고도의 ‘추천 시스템’을 산업에 적용할 것을 목표로 2016년에 설립되었는데, 2017년에 추천 시스템의 콘테스트인 ‘ACM RecSys Challenge 2017’에서 1위를 차지하였음

▸ 레이어 6가 흥미로운 것은 2018년 1월 캐나다의 유력 금융기관인 TD(Toronto-Dominion) 뱅크 그룹에 인수된 후에도 논문 발표 등 연구 활동을 지속하고 있다는 점

▸ TD 뱅크 인수 이후 레이어 6의 주요 사업은 은행을 위한 추천 시스템의 개발이었지만, 동시에 구글이 개최하는 이미지 인식 기술 콘테스트인 ‘Google Landmark Recognition Challenge 2018’에 참가하는 등 기업활동 이외의 연구 활동도 계속하고 있음

▸ 힌튼 문하이자 벡터 연구소 공동 설립자 중 한명인 브렌단 프레이(Brendan Frey) 역시 토론토 대학의 교수로 계속 재직하면서 2015년에 창업한 딥러닝 기반 신약 개발 스타트업인 ‘딥 제노믹스(Deep Genomics)’를 이끌고 있음

▸ 딥 제노믹스는 유전자 치료에 딥러닝 적용을 시도하고 있는데, 환자의 유전자에서 암의 원인이 되는 결함을 찾아내는 AI와, 그러한 유전자의 결함을 겨냥한 화합물을 찾아내는 AI 등을 모두 딥러닝 기반으로 개발하고 있음

▸ 토론토와 인근 지역은 사실 유명 기술기업을 많이 배출해 온 곳인데, 토론토 북쪽 마크햄에서는 GPU 메이커인 ATI 테크놀로지스(현재 AMD 산하)가, 토론토 서쪽 워털루에서는 블랙베리를 만든 RIM과 콘텐츠 관리 솔루션 기업 오픈텍스트(OpenText)가 태어났음

▸ 마크햄이나 워털루에서는 제 2의 ATI나 블랙베리를 만들기 위해 2000년대부터 스타트업 육성 시설을 마련했으며, 지금은 AI 스타트업 육성에 주력하고 있는데, AI 인재를 실리콘 밸리에 빼앗기지 않겠다는 토론토의 의지가 아주 강렬함을 잘 보여주는 사례임

◾ 토론토에 이어 캐나다 제2의 도시인 몬트리올의 수퍼클러스터도 AI 연구소가 인재를 육성하고, 이들을 찾아 대기업의 연구소가 들어서는 등 토론토와 비슷한 양상을 보이고 있음

▸ 몬트리올은 딥러닝 연구 전문가로 제프리 힌튼과 쌍벽을 이루는 요수아 벤지오 교수를 중심으로 학계와 스타트업이 대기업과 적극적으로 협력하고 있음

▸ 몬트리올에서는 벤지오 교수가 재직 중인 몬트리올 대학, 벤지오의 출신학교인 맥길 대학, 벤지오가 연구 책임자로 있는 몬트리올 학습 알고리즘 연구소(Montreal Institute for Learning Algorithms, MILA) 등 3개 기관이 AI 연구 및 AI 인재 육성의 중심임

▸ 몬트리올 도시 지역의 상업 진흥 단체인 ‘몬트리올 인터내셔널’에 따르면, 몬트리올에는 250명의 AI 연구자가 거주하고 있으며, 9,000명의 대학생이 AI 관련 수업을 대학에서 수강하고 있다고 함

▸ 몬트리올에는 대기업의 AI 연구 거점 개설도 한창이어서, 2016년에는 구글 브레인 팀이, 2017년에는 딥마인드가 각각 AI 연구소를 개설했는데, 특히 딥마인드는 앨버타에 이어 몬트리올에 두 번째 캐나다 내 AI 연구 거점을 마련한 것임

▸ 마이크로소프트는 2017년에 몬트리올의 스타트업인 ‘말루바(Maluuba)’를 인수하고, 이 기업을 캐나다 내 MS의 AI 연구 조직으로 개편한 바 있음

▸ 이 밖에도 IBM, 페이스북, 삼성전자, 프랑스의 전자 대기업인 탈레스 그룹(Thales Group) 등이 모두 2017년에 몬트리올에 AI 연구 거점을 개설하였음

◾ AI에 기반을 둔 디지털 변혁을 추진하기 위해 캐나다 정부가 AI 공급망 구축을 목표로 설립한 조직인 ‘SCALE.AI(Supply Chains and Logistics Excellence AI)'의 본부도 몬트리올에 있음

▸ AI 공급망은 AI 인력 및 AI 기술을 일반 기업에 공급하는 구조를 구축하려는 것으로, AI 스타트업의 육성뿐 아니라 AI에 의한 디지털 변혁(Digital Transformation)이 모든 산업 분야에서 촉진되도록 하려는 캐나다 정부의 목표가 반영된 것임

▸ 벤지오 교수가 공동 창업자로 있는 스타트업이 AI 공급망 구축의 앞장서고 있는데, 2016년에 설립된 ‘엘리먼트 AI(Element AI)’는 2017년 6월에 시리즈 A 펀딩으로 1억 3,750만 달러를 조달, AI 스타트업의 시리즈 A 자금으로는 사상 최대 규모를 확보한 바 있음

▸ 엘리먼트 AI는 대기업에 AI 솔루션을 제공하고 AI 연구자들의 창업을 지원하는 스타트업으로, 직원은 300명이며, 몬트리올, 토론토, 런던, 서울, 싱가포르에 거점을 두고 있음

▸ 현재 주요 고객은 금융업과 제조업으로, 엘리먼트 AI 소속 AI 연구자가 중심이 된 팀이 6개월에 걸쳐 고객 기업의 업무 흐름을 분석하고 어떤 AI를 도입하면 업무를 근본적으로 혁신할 수 있는지 로드맵을 수립한 후, 여기서 개발한 기계학습 앱을 도입한다고 함

▸ 엘리먼트 AI의 목적은 디지털 마케팅 및 보안과 같은 포인트 솔루션의 제공이 아니며, 기업이 자신들의 데이터를 제공하면 기계가 데이터를 기반으로 기업의 업무 프로세스 전반을 최적화하는, 모든 용도에 사용할 수 있는 AI 플랫폼을 제공하는 것임

▸ 엘리먼트 AI가 솔루션을 제공하는 곳은 주로 전통 산업에 속해 있는 대기업, 즉 거대하고 변화가 느린 기업인데, 왜냐하면 거기에 큰 기회가 있다고 보기 때문임

▸ 이에 대해 벤지오 교수는 뛰어난 AI 인재들일수록 큰 성장이 기대되는 스타트업이나 실리콘밸리를 지향하는 경향이 있어 대기업의 AI 인재 채용이 어렵기 때문이라 설명

▸ 그러나 대기업은 거대한 시장을 확보하고 있고 자금도 이미 풍부하며 또한 그들 밖에 가지고 있지 않은 빅데이터가 있기 때문에, 벤지오 교수는 엘리먼트 AI가 스타트업에 눈을 돌리기 쉬운 AI 인력과 대기업을 중개하는 역할을 하게 되기를 희망하고 있음

<자료> ITPro

[그림 2] 몬트리올 대학의 요수아 벤지오 교수

◾ 벤지오 교수는 AI 기술이 특정 국가에 독점되지 않고 사회 전반적으로 활용되도록 하는데 관심이 많은데, 그의 이런 생각은 엘리먼트 AI와 캐나다 정부의 정책에 영향을 미치고 있음

▸ 엘리먼트 AI의 직원들은 입사 후에도 몬트리올의 MILA와 토론토의 벡터 연구소 등 산학 협력 기반의 AI 연구소와 연계한 AI 기초 연구를 지속하고 있는데, 이는 AI 인재들이 학계에 상주하는 것이 필요하다는 벤지오 교수의 생각이 반영된 것임

▸ 벤지오의 행보는 종종 토론토 대학의 힌튼과 비교되는데, 힌튼은 문하생들과 창업한 DNN리서치(DNNresearch)를 구글에 매각하였고, DNN리서치는 구글의 AI 연구 부문이 되었으며 힌튼은 토론토 대학 교수직과 구글의 연구자 역할을 겸임하고 있음

▸ 이에 대해 벤지오 교수는 구글이나 페이스북에 가지 않고 학계에 상주하는 것이 아주 중요하다며, 자신이 창업한 엘리먼트 AI를 실리콘밸리 거대 IT 기업에 매각할 의향이 절대 없음을 밝히고 있음

▸ 그 이유는 AI 사용의 중립성 때문인데, 사람들에게 좋은 일과 사회에 좋은 일만 계속 생각하고 싶다며, 구글이나 페이스북에도 AI 연구소가 있지만 과연 그들의 연구가 중립적이고 지속가능한 것인가에 대해 의문을 표시하고 있음

▸ 벤지오가 가장 우려하는 것은 AI의 독점인데, AI에 의한 비즈니스 자동화는 기업 간 격차를 확대할 뿐 아니라 나아가 AI의 독점에 의해 국가 간 격차를 조장할 수 있기 때문

▸ 특정 국가에 AI의 힘이 독점 되지 않도록, 벤지오 교수는 캐나다 연구진과 유럽 등의 연계를 중시하고 있는데, 여기서 ‘특정 국가’는 물론 미국을 의미함

▸ AI 공급망을 통해 모든 기업에 AI를 보급시켜 나간다는 캐나다 정부와 엘리먼트 AI의 목표는 실리콘밸리의 미국 기업들이 AI를 독점하게 못하게 하겠다는 벤치오 교수의 철학에 기인한 바가 큼

[표 2] 몬트리올과 토론토에 AI 연구 거점을 마련한 주요 글로벌 기업

구분

몬트리올

토론토

AI 연구 거점

설립 기업

(미국) 구글, 마이크로소프트, 페이스북

(한국) 삼성전자

(영국) 딥마인드

(프랑스) 탈레스 그룹

(미국) IBM, 구글, 우버 테크놀로지, 톰슨로이터, 엣시, 엔비디아

(한국) 삼성전자, LG전자

<자료> ITPro, Jul 2018

◾ 캐다나의 AI 연구 인프라가 미국 이외 유럽 지역과 연계를 강화하는 대표적 사례는 프랑스 전자 대기업 탈레스 그룹이 몬트리올에 AI 연구소 ‘cortAIx'를 설립한 것임

▸ 몬트리올은 프랑스어가 공용어인 퀘벡 주에 있어 프랑스와 유대가 강한데, 프랑스 전자 대기업은 탈레스 그룹은 2017년 10월에 AI 연구소 ‘cortAIx(Centre of Research and Technology in Artificial Intelligence eXpertise)’를 몬트리올에 설치하였음

▸ cortAIx는 MILA 등 몬트리올의 AI 에코시스템과 연계하여 교통 시스템 등 탈레스 그룹의 비즈니스 영역에서 딥러닝 적용을 추진하는 것을 목적으로 하며, cortAIx는 몬트리올에서 50명의 AI 연구자를 채용한다는 계획을 갖고 있음

▸ 탈레스는 방위 사업도 하고 있지만 cortAIx는 군사 분야 연구는 제외하고 있는데, 이는 벤지오 교수를 비롯해 AI 연구자 대부분이 AI가 군사 및 첩보 분야에서 활용될 것을 우려한다고 지적한 것을 수용했기 때문

▸ 제너럴 일렉트릭(GE)과 포드자동차 등 미국의 전통적 대기업이 실리콘밸리에 AI 연구 거점을 마련하는 움직임을 보이고 있지만, 탈레스 그룹의 사례를 기점으로 유럽의 전통 기업들은 몬트리올을 AI 연구 거점의 1순위 후보로 검토할 가능성이 높아지고 있음

◾ 캐다나 주요 도시의 AI 수퍼클러스터들은 교육과 인재 양성에 대한 장기적 안목의 투자와 함께, 산업 응용과 학문적 연구 사이의 건강한 긴장관계가 핵심성공요소임을 재확인

▸ 다양한 산업에서 성공을 거두고 있는 클러스터들의 공통점은 대부분 장기간에 걸친 교육의 혁신과 이를 통해 인재들이 지속적으로 양성되는 시스템을 갖추고 있다는 것인데, 캐나다의 AI 수퍼클러스터들 역시 동일한 특성을 보여주고 있음

▸ 이는 AI에 대한 초기 관심이 잦아들고 기술발전 속도도 답보하며 소위 AI의 겨울이라 불렸던 1990년대 이후 약 20년 동안에도 연구개발투자를 아끼지 않았던 캐나다 정부의 뚝심에 기인한 것으로 캐나다가 AI 산업을 선도할 수 있는 강력한 토대가 되고 있음

▸ 교육에 대한 장기적 투자는 뒤늦게 AI 연구와 클러스터 구축을 시작해 한 자칫 단기적 성과에 집착하기 쉬운 후발주자들이 귀감으로 삼아야 할 지점임

▸ AI 기술연구를 토대로 스타트업 창업을 지원하되 창업 이후에도 지속적으로 연구활동을 병행할 수 있는 환경을 조성하는 것도 캐나다 AI 생태계의 강점인데, 기업과 학문간의 건강한 교류는 AI 기술과 경제를 폭넓은 관점에서 조망하게 하는 힘이 되고 있음

▸ 캐나다의 AI 생태계는 개별 기업이 아닌 사회 전체, 나아가 전지구적 관점에서 AI 기술의 고른 보급과 활용을 지향하고 있으며, 이는 전세계가 캐나다의 AI 생태계를 찾고 캐나다가 글로벌 AI 연구와 산업을 선도할 수 있는 강력한 원동력이 되고 있음

저작자표시 비영리 동일조건

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

웨더뉴스-엔비디아, AI 이용한 전세계 강우 상황 가시화 프로젝트 (0)	2018.09.28
싱가포르 정부,‘AI 거버넌스 프레임워크’ 구축의 방법론 제시 (0)	2018.09.12
페이스북, 실생활에서 상식을 익히고 사람의 말을 이해하는 AI 개발 (0)	2018.08.23
구글 ‘콜센터 AI’ 서비스 발표, 상담원과 AI의 협업 솔루션 강조 (0)	2018.08.17
오픈AI, 위화감 없이 두 얼굴을 합성해 주는 ‘글로우’ 기술 발표 (0)	2018.07.18

페이스북, 실생활에서 상식을 익히고 사람의 말을 이해하는 AI 개발

주간기술동향 최신ICT이슈/인공지능(AI) 2018. 8. 23. 13:11 Posted by Purple Frog

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1860호(2018. 8. 22. 발행)에 기고한 원고입니다.

▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

페이스북, 실생활에서 상식을 익히고 사람의 말을 이해하는 AI 개발.pdf

[ 요 약 ]

인공지능(AI) 기술이 비약적으로 발전하며 사람과 자연스럽게 대화할 수 있는 구글 듀플렉스 같은 서비스도 등장했지만, 페이스북은 그런 것은 어디까지나 매우 제한된 상황에서 AI가 뜻도 모른 채 사람의 말을 모방하는 것이라 보고 있음. 이런 한계 극복을 위해 페이스북은 AI가 실제 사회에서 사람과 상호작용하며 인간과 마찬가지 방식으로 지능을 획득하도록 하는 연구를 진행 중인데, ‘토크 더 워크’와 ‘임바디드 비전’등이 주목받는 프로젝트

[ 본 문 ]

◾ 페이스북 인공지능 연구소(AI Research)는 AI가 거리로 나와 실제 사회와 상호작용을 통해 지성(인텔리전스)을 습득하는 기술을 연구하고 있음

▸ AI의 등장으로 자연어 분석 기술이 비약적으로 발전했는데, 특히 기계 번역(Machine Translation)와 자연어 이해(Natural Language Understanding) 부문에서 AI가 급속한 발전을 거듭하면서 인간 생활의 편의성 향상을 지원할 수 있게 되었음

▸ 그러나 AI가 번역과 대화를 할 수 있게 되었다고는 하지만 알고리즘이 말의 의미를 이해하고 있는 것은 아니며, 아직은 어디까지나 말의 뜻을 모른 채 AI가 인간을 모방하는 것이며 대화하는 것처럼 보이는 것이 지나지 않음

▸ 가령 사람과 너무 흡사해 경악스럽다는 반응을 이끌어 낸 ‘구글 듀플렉스(Duplex)’의 경우도, 직접 테스트에 나선 IT 기자들이 고의로 엉뚱한 대답을 내놓자 무슨 말인지 몰라 전혀 대응하지 못하는 모습을 보였음

▸ 따라서 페이스북 AI 연구소는 AI의 자연어 기능이 향상되고 멋진 가상 비서의 등장이 잇따르고 있지만 정말 유용한 가상 도우미를 개발하려면 AI가 지능을 갖도록 만들어 사람처럼 말의 의미를 이해할 필요가 있다는 생각을 갖고 있음

▸ 연구소측에 따르면 AI가 지능적이 될 수 없는 이유는 교육 방법에 있는데, 알고리즘이 대량의 텍스트 데이터로 교육을 받고, 통계 기법에 기초해 번역과 대화를 하기 때문임

▸ 따라서 페이스북 AI 연구소는 지능적인 AI를 개발하려면 알고리즘이 실제 사회 속에서 주변 환경이나 다른 사람과 교제를 하며 말을 배움으로써 단어의 의미를 이해하고 말을 할 수 있게 된다고 주장함

◾ 페이스북 AI 연구소는 최근 이와 관련한 논문을 발표하고, 길거리에서 관광객을 안내해 주는 ‘토크 더 워크(Talk the Walk)’라는 교육 모델을 소개하였음

▸ 연구소 측은 말을 환경과 연계하는 방법으로 AI를 교육시키는 연구를 진행하고 있으며, 이 주제에 관한 논문 'Talk the Walk: Navigating New York City through Grounded Dialogue(토크 더 워크: 현실적 대화를 통해 뉴욕 시에서 길을 찾기)'를 발표하였음

Talk the Walk-Navigating New York City through Grounded Dialogue.pdf

▸ 논문은 AI가 거리에 나와 실제 사회와 상호작용을 통해 지능을 습득하는 기법을 보여주고 있으며, 두 개의 AI(에이전트)를 생성하는데, 첫 번째 AI는 ‘가이드 에이전트’이고 두 번째 AI는 ‘관광객 에이전트’이며 두 에이전트는 서로 떨어져 있음

▸ 이 작업은 ‘Talk the Walk(토크 더 워크)’라고 불리며, 대화를 통해 가이드 에이전트가 길을 잃은 관광객 에이전트를 목적지까지 말로 안내하는 과정을 보여 줌

▸ 원래 영어 표현에서 ‘Walk the Talk(워크 더 토크)’는 ‘말한 것을 실천에 옮기다’라는 뜻인데, ‘토크 더 워크’는 ‘실천할 것을 말해주기’ 정도로 번역할 수 있음

<자료> Dhruv Batra et al.

[그림 1] Talk the Walk 교육 모델: 대화를 통한 인간의 언어 이해 모델

◾ ‘토크 더 워크’ 교육 모델은 길을 잃은 관광객이 안내소로 전화를 해 목적지까지 가는 경로에 대한 설명을 듣는 상황을 재현하고 있음

▸ 실험에서 두 에이전트(가이드와 관광객을 대표)는 뉴욕 시내에서 대화를 하게 되는데, 가이드는 지도를 보며 목적지를 파악할 수 있지만 관광객의 위치는 모르며, 반면 관광객은 지도를 볼 수는 없지만 자신이 처한 곳의 사방 풍경을 보고 말할 수 있음

▸ 가이드는 길을 잃은 관광객과 대화를 주고받게 되며, 관광객이 가고자 하는 목적지에 도달할 수 있도록 방향을 유도함

▸ 연구팀은 이 작업을 수행하기 위해 뉴욕의 다섯 지역을 선택해 그 지도를 생성했는데, 지도에는 360도 카메라로 촬영한 영상(스트리트 뷰)이 포함되어 있고, 이는 관광객 에이전트가 교차로의 모서리에 주위의 풍경을 둘러보는 상황에 활용됨

▸ 또한 사진에 찍힌 유명 바나 은행, 상점 등의 랜드마크에는 그것이 무엇인지 알려주는 태그를 붙여, 관광객 에이전트가 간판을 보고 답을 할 수 있는 상황을 설정하였음

▸ 한편, 가이드 에이전트용으로는 2D 지도를 준비하였고, 여기에는 도로명과 주요 랜드마크들을 표시하였음

▸ 태스크는 간단한데, 관광객은 스트리트 뷰를 보고 눈앞에 있는 랜드마크를 가이드에게 알려주며, 가이드는 이 정보를 단서로 관광객의 현재 위치를 파악하고 목적지까지 갈 수 있도록 길 안내를 함

▸ 가이드는 관광객이 목적지에 도착했다고 확신한 시점에 길 안내를 멈추며, 시스템이 관광객이 정말 목적지에 도착했는지 검증한 후 일련의 작업이 종료됨

<자료> Facebook AI Research

[그림 2] 가이드 에이전트와 관광객 에이전트의 대화(인간의 언어로 대화)

◾ 논문에 따르면 가이드 에이전트의 관광객 길 안내 정확도는 88.33%로, 실제 사람이 안내했을 때의 정확도 76.74%를 웃도는 것으로 나타남

▸ 가이드 에이전트가 관광객을 안내하기 위해서는 먼저 관광객의 주변 풍경 설명을 듣고 위치를 파악해야 하는데, 이를 위해 연구팀은 풍경의 묘사를 말로 전달받고 이를 위치정보로 변환하는 기능을 가진 ‘위치결정 모델’을 개발하였음

▸ 모델의 명칭은 ‘Masked Attention for Spatial Convolutions(MASC)’이며, 연구팀은 뉴욕 시내에서 MASC를 테스트하고 그 성능을 평가하였음

▸ 평가 결과 두 에이전트의 MASC 판정 정확도는 88.33%를 기록했으며, 실제 사람끼리 동일한 작업을 실행했을 때의 판정 정확도는 76.74%였음

▸ 단, 이번 연구에서 높은 정확도를 기록한 AI 간의 대화는 인간의 말을 사용한 것은 아니고 특별한 언어 모델(Emergent Communication)을 사용했는데, 이 방식에서는 AI가 생성하는 원시 데이터를 이용하여 대화하게 됨

▸ 한편, AI가 인간의 말을 사용해 대화할 경우 MASC 판정 정확도는 50.00%로 감소하는데, 연구팀은 이런 평가 결과로 볼 때 인간의 언어는 정보를 정확하게 전달하는데 적합한 구조가 아님을 알 수 있다고 결론

<자료> Facebook AI Research(클릭하면 동영상을 보실 수 있습니다)

[그림 3] Talk the Walk 학습 모델의 정확성(에이전트 간 원시 데이터 이용 대화의 경우)

◾ 이번 연구는 AI가 불완전한 커뮤니케이션 도구인 사람의 언어를 정확하게 이해하기 위해서는 사람들이 그러한 것처럼 실제 환경 속에서 언어를 배울 필요가 있음을 보여주고 있음

▸ 토크 더 워크가 AI에 제공한 언어를 배울 수 있는 프레임워크는 ‘가상의 전형(Virtual Embodiment)’이라 불리는데, 이는 여러 에이전트가 조성된 환경 속에서 체험을 통해 말의 의미를 학습하는 기법을 말함

▸ 토크 더 워크는 이런 컨셉에 기반을 둔 것으로 AI는 사회와 상호작용을 통해 지각(Perception), 행동(Action), 쌍방 커뮤니케이션(Interactive Communication) 기능을 학습함

▸ 이번 연구에서는 AI가 인간의 말을 사용하여 커뮤니케이션 할 때 의사소통의 정확성이 크게 저하됨을 보여주었는데, 이는 거꾸로 불완전한 커뮤니케이션 도구인 인간의 언어를 정확하게 파악하는 것이 AI에 부과된 명제라 할 수 있음

▸ 미션 수행을 위해서는 AI 역시 사람들이 해온 것처럼 환경과 접목되어 있는 언어를 배우려는 노력이 필요한 것이며, 이를 반영해 페이스북 AI 연구소는 워크 더 토크를 오픈소스로 공개해 AI가 언어를 배울 수 있는 환경을 확산시키려 하고 있음

◾ 한편 페이스북 AI 연구소는 토크 더 워크 외에도 AI가 상호작용을 통해 지능을 얻게 하려는 다양한 연구를 함께 진행하고 있는데, ‘임바디드 비전(Embodied Vision)’도 그 중 하나

Embodied Question Answering.pdf

▸ 지난 6월 샌프란시스코에서는 로봇의 두뇌인 딥러닝에 초점을 맞춘 로보틱스 분야 컨퍼런스 ‘RE·WORK Deep Learning in Robotics Summit’가 열렸는데, 오픈AI, 구글 브레인 등 주요 플레이어들이 참가해 기초 기술부터 응용 기술까지 폭넓게 논의하였음

▸ 페이스북 AI 연구소도 이 서밋에 참가하여 ‘임바디드 비전’이라는 최신 AI 기술을 소개하였는데, 번역하면 ‘개념을 구체화한 컴퓨터 시각장치’ 정도의 의미로 흔히 사용하는 ‘컴퓨터 비전(Computer Vision)’ 기술과 대비할 수 있음

▸ 컴퓨터 비전이 로봇 혹은 에이전트의 시각 능력을 의미하는 것에 비해, 임바디드 비전은 로봇의 ‘인지 능력’을 가리킨다고 볼 수 것인데, 로봇이 주위의 개체를 단순히 파악할 뿐만 아니라 사람처럼 그것의 의미를 이해하는 데 보다 중점을 두고 있음

▸ 토크 더 워크와 마찬가지로 임바디드 비전 역시 AI가 인간처럼 지능적이 되기 위해서는 ‘상호작용을 통한 학습(Learning from Interaction)’이 필요하다는 명제에 기반을 둠

▸ 지금까지 AI는 주어진 데이터 세트를 가지고 컴퓨터 비전을 통해 학습했는데, 가령 사진 데이터 세트인 ‘이미지넷(ImageNet)’으로 개와 고양이의 구분법을 배우는 것임

▸ 이제 AI는 그 다음 단계의 학습, 즉 물건을 만지며 그 의미를 학습하는 단계로 넘어가야 하는데, 마치 아기가 손으로 만져가며 물건의 의미를 배우듯이 AI도 상호작용을 통해 기초 지식을 학습할 필요가 있다는 것이 페이스북의 생각임

◾ 이를 위해 페이스북 AI 연구소는 AI 교육을 위한 가상 환경으로 ‘하우스3D(House3D)’를 개발했는데, 주택 내부를 3D로 표현한 것으로 로봇은 이 안을 이동하며 상식을 배워 나감

▸ 로봇이 하우스3D 안을 이동하면 눈앞의 장면이 바뀔 뿐만 아니라 각 장면에 등장하는 객체에는 이름이 붙어 있는데, 이는 로봇이 가상 환경을 돌아다니며 객체를 접하는 과정에서 객체의 의미를 학습하도록 한 것임

▸ 로봇이 여느 방과는 다른 유형의 공간인 부엌으로 이동하게 되면, 거기에 설치되어 있는 오븐과 식기 세척기 등의 객체를 배우고 부엌의 의미를 학습하게 됨

<자료> Georgia Gkioxari et al.

[그림 4] AI 교육을 위한 가상 환경 하우스3D를 통해 방의 이름과 방안의 객체를 학습

◾ 페이스북 AI 연구소는 세 가지 측면에서 로봇을 교육하는데, 로봇이 각각의 교육을 통해 학습한 것을 토대로 추론함으로써 질문에 대한 답을 찾을 수 있게 하는 것이 목표임

▸ 첫 번째 교육은 로봇이 가상 환경에서 물건을 보고 단어의 의미를 학습하게 하는 ‘언어 기초교육(Language Grounding)’으로 로봇은 환경 속에서 물건과 이름을 연결함

▸ 두 번째 교육은 로봇이 집안에서 지정된 위치로 이동하게 하는 ‘비주얼 내비게이션(Visual Navigation)’으로 로봇은 집안의 통로를 더듬어 찾아 가 문을 열고 지정된 위치까지 이동하게 됨

▸ 세 번째 교육은 로봇이 어떤 질문을 받으면 집안을 돌아다니며 그 답을 알아내도록 하는 ‘임바디드QA(EmbodiedQA)’로 로봇은 답변을 찾기 위해 가상 환경 속을 이동함

▸ 기존의 로봇은 질문을 받으면 인터넷 검색을 통해 그 답을 찾지만, 임바디드QA에서는 실제 공간으로 이동하여 답을 구하는데, 가령 ‘자동차가 무슨 색이지?’라는 질문을 받으면 로봇은 그 질문의 의미를 이해하고 집안에서 자동차를 찾기 시작함

▸ 이 때 로봇은 자동차는 차고에 주차되어 있다는 상식을 가동해 집안에서 차고를 향해 나아가게 되며, 차고의 정확한 위치를 모르더라도 다시 한 번 습득한 상식을 가동해 차고는 야외에 있을 것으로 추측하게 됨

▸ 결국 로봇은 현관에서 야외에 나와 정원을 가로질러 이동한 뒤 차고에 도착하고, 거기에서 자동차를 발견해 그 색이 무슨 색임을 파악한 후 답을 할 수 있게 되는 것임

<자료> 5Georgia Gkioxari et al. 클릭하면 자세히 보실 수 있습니다.

[그림 5] 임바디드QA 작동 과정

◾ 이처럼 사람이 무언가를 배우는 것처럼 AI를 교육시키려 한다면, 로봇의 두뇌에는 광범위한, 그리고 다양한 AI 기술들이 구현되고 연계될 필요가 있음

▸ 구체적으로 살펴보면, 로봇의 두뇌에는 시각(Perception), 단어의 이해(Language Understanding), 길 찾기 능력(Navigation), 상식 추론(Commonsense Reasoning), 그리고 말과 행동의 연결(Grounding)이 필요하게 됨

▸ 페이스북 AI 연구팀은 로봇에 이런 기능을 구현해, 앞서 설명한 3D 가상 환경인 하우스3D에서 임바디드QA 모델을 구축하는 작업을 수행하는 데 성공한 것임

▸ 이 모델에서 로봇의 두뇌는 ‘플래너(Planner)’와 ‘컨트롤러(Controller)’로 구성되며, 심층강화학습(Deep Reinforcement Learning)을 통해 교육시켰다고 함

▸ 플래너는 지휘자로서 로봇의 진행 방향(전후좌우)을 결정하고, 컨트롤러는 실행자로서 지시대로 진행의 속도(스텝의 수)를 결정함

▸ 플래너는 ‘장단기 메모리(Long Short-Term Memory, LSTM)’라는 유형의 네트워크로 구성되고 상술한 바와 같이 심층강화학습으로 교육시키는데, 사람처럼 시행착오를 통해 상식을 습득한다고 함

<자료> Georgia Gkioxari et al.

[그림 6] 플래너(Planner)의 LSTM 네트워크 구성

◾ 페이스북의 이러한 지능형 로봇 개발은 지금까지의 AI 개발 방식과 완전히 다른 것이나, 경쟁자들도 점차 이 방식을 수용하고 있어 향후 개발 경쟁이 가속화될 것으로 보임

▸ AI 기술은 빠르게 진화하고 있으며 이미지 판정 능력은 이미 인간을 한참 웃돌며, 사람에게는 안 된다는 바둑 세계에서조차 이미 AI는 인간을 넘어선 바 있음

▸ 그럼에도 AI를 지능적 혹은 지적이라 말하기는 아직 요원한데, 이미지 판정 AI가 고양이를 식별하더라도 고양이의 의미를 이해하는 것은 아니며, 알파고는 바둑이라는 제한된 작업만 실행할 수 있을 뿐 자동차를 운전할 수는 없기 때문

▸ 지금의 로봇은 인간처럼 집안을 이동하는 것조차 할 수 없는데, 눈부신 발전에도 불구 인간처럼 지능적으로 사고 할 수 있는 AI의 개발은 뾰족한 돌파구 없이 답보 상태에 있다는 냉정한 평가도 나오고 있는 상황임

▸ 이런 상황을 타개하고자 페이스북 AI 연구소는 이전과는 완전히 다른 방식으로 AI를 개발하려고 하는 것이며, 실생활을 모방한 3D 가상 환경에서 AI를 교육시키고 이런 가운데 AI가 복잡한 작업을 스스로 배워 나가게 하는 것을 목표로 삼고 있음

▸ 즉, AI가 실제 사회 속에서 학습함으로써 인간과 같은 시각을 갖고 자연스러운 대화를 할 수 있으며, 다음 계획을 세우고 지적 사고를 할 수 있는 알고리즘을 개발하려는 것임

▸ 페이스북이 앞서가고 있기는 하지만 오픈AI나 딥마인드 등도 이 방식을 택하고 있어 앞으로는 정교한 가상 환경에서 심층강화학습으로 교육받은 알고리즘 개발 경쟁이 치열하게 전개될 것으로 예상됨

◾ 로봇이 사람처럼 지능적으로 된다면 인간의 삶도 근본적인 변화를 맞이할 수 있을 것인데, 페이스북이 개발 중인 가정용 로봇의 출시는 인류의 역사에 또 하나의 이정표가 될 전망

▸ 페이스북은 가상 비서 ‘M’을 개발해 왔지만 제품 출시 작업은 중단했는데, M이 호텔의 컨시어지처럼 어떤 질문에도 대답해주는 것을 목표로 했지만 사람과 대화는 주제의 폭이 너무 넓어 AI가 이에 전혀 대응하지 못했기 때문

▸ 이런 실패를 극복하고자 새로이 임바디드 비전 기술을 연구 중인 것인데, 최근 페이스북 역시 AI 스피커를 개발 중이라는 추측성 보도가 나온 바 있어 혹 임바디드 비전 기술에 바탕을 둔 제품인지 여부에 관심이 모이고 있음

▸ 또한 연구 내용에서 보듯, 기술 개발이 잘 진행된다면 가정용 로봇 개발 로드맵이 자연스레 떠올려지게 되는데, 과연 페이스북이 지능형 가정용 로봇을 개발할지, 그 로봇의 상용화 시점은 언제쯤일 지에도 귀추가 주목되고 있음

▸ 사람처럼 지능을 얻을 수 있는 로봇의 등장은 현재의 AI 논쟁과는 비교할 수 없을 정도의 사회적 논란을 야기할 것이며, 그 만큼 우리 삶의 모습을 근본적으로 뒤바꿔 놓을 가능성이 있어, 페이스북의 AI 연구 개발 성과에 큰 우려와 기대가 함께 쏟아질 전망

저작자표시 비영리 동일조건

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

싱가포르 정부,‘AI 거버넌스 프레임워크’ 구축의 방법론 제시 (0)	2018.09.12
전세계 디지털 혁신 공급망을 꿈꾸는 캐나다의 AI 수퍼클러스터 (0)	2018.08.31
구글 ‘콜센터 AI’ 서비스 발표, 상담원과 AI의 협업 솔루션 강조 (0)	2018.08.17
오픈AI, 위화감 없이 두 얼굴을 합성해 주는 ‘글로우’ 기술 발표 (0)	2018.07.18
다음에 쓸 문장을 자동으로 알려주는 G메일의 새로운 AI 기능 (0)	2018.07.18

구글 ‘콜센터 AI’ 서비스 발표, 상담원과 AI의 협업 솔루션 강조

주간기술동향 최신ICT이슈/인공지능(AI) 2018. 8. 17. 10:23 Posted by Purple Frog

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1859호(2018. 8. 15. 발행)에 기고한 원고입니다.

▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

구글 ‘콜센터 AI’ 서비스 발표, 상담원과 AI의 협업 솔루션 강조.pdf

[ 요 약 ]

올해 초 사람과 흡사한 가상 비서 듀플렉스를 공개했던 구글이 최근 이 기술을 기업 콜센터에 적용한 ‘컨택트 센터 AI' 서비스를 발표하였음. 데모 영상에서 AI는 대화를 통해 고객의 전화 의도를 파악한 후 필요한 절차를 진행하고 고객이 원하면 상담원과 연결해 주는 기능을 선보였음. 구글은 콜센터 AI 서비스가 상담원의 일자리를 없애는 것이 아니라 업무를 지원하는 협업 솔루션임을 강조하고 있지만 실제 그렇게 될 지는 지켜볼 필요가 있음

[ 본 문 ]

◾ 구글의 과학연구 책임자 페이페이 리는 ‘구글 클라우드 넥스트(Google Cloud Next)’ 행사의 기조연설에 등단해 콜센터 시스템에 인공지능(AI)을 통합한 서비스를 발표하였음

▸ 서비스 명칭은‘컨택트 센터 AI(컨택트 센터 AI)’로 콜센터 상담원(오퍼레이터)들의 업무를 AI로 대행해 주는 기업용 솔루션인데, 고객의 질문이 간단한 것이라면 질문에 직접 대답하고 사람의 대응이 필요할 경우 문의자를 적합한 직원에게 연결해 줌

<자료> Google

[그림 1] 컨택트 센터 AI 발표

▸ 페이페이 리(Fei-Fei Li)는 날마다 콜센터에서 벌어지는 어려움에 대해 연구하면서 단순한 거래나 정보성 문의가 상당히 많다는 것을 발견했으며, AI를 통해 고객과 대응 직원의 경험을 동시에 향상하는 방법을 고민하게 되었다고 개발 배경을 설명

▸ 단순 상담이 과도해지면서 콜센터 직원들을 반복 업무와 빠른 처리에 대한 압박 증가로 복잡한 문제 해결에 필요한 시간이 줄어드는 어려움을 느끼고 있고, 고객 역시 직관적이지 않은 ARS 메뉴, 상담 대기 시간 증가로 사용자 경험이 훼손되고 있다는 것

▸ 컨택트 센터 AI는 기존의 트리형 전화 시스템을 상담원이 전화를 받기 전에 가상 AI 직원이 질문에 답하는 시스템으로 바꾸게 되는데, 구글 컨택트 센터 AI가 맥락 정보를 제공하기 때문에 상담원이 전화를 넘겨받은 후에는 같은 질문을 반복할 필요가 없다고 함

◾ 컨택트 센터 AI 서비스의 초기 베타 테스트에 참여하고 있는 곳은 ‘이베이(eBay)’인데, 이베이는 고객과 자연스럽게 대화하는 시스템으로 기존 콜센터의 문제를 해결하고자 함

▸ 이베이는 그 동안 구글 클라우드, 이베이의 컨택트 센터 기술 공급업체인 제네시스(Genesys)와 함께 트리형 전화 교환 시스템을 없애고 자연어 기반 봇을 활용하는 개발 작업에 집중해왔다고 함

▸ 이베이의 고객 서비스 부문 부사장인 댄 레이바(Dan Leiva)는 구글과 진행하는 시범 프로젝트의 목표는 콜센터가 안고 있는 3가지 문제를 해결하는 것이라 밝혔음

▸ 첫 번째 문제는 전화하는 고객이 짜증나는 트리형 시스템을 돌아다니면서 끝없는 질문에 응답해서야 겨우 기업이 고객의 전화 목적을 파악하게 되는 현상으로, 이 때문에 대부분의 문의 전화는 중도에 상담원 직접 통화 요청으로 이어지게 됨

▸ 두 번째 문제는 반복적으로 똑같은 정보를 제공하는 현상으로, 마침내 상담원과 통화하게 되더라도 문의 시간의 절반은 이미 앞에서 입력하고 대답했던 정보를 다시 제공하는 데 쓰이는 경우가 많음

▸ 마지막 문제는 고객 문의를 해결하기 위해 상담원이 접근할 수 있는 정보에 한계가 있다는 점으로, 어렵게 상담원과 연결되어도 결국 고객은 문제를 해결하지 못하게 됨

▸ 이베이에 콜센터 시스템을 공급해 오던 제네시스 역시 ‘예/아니오’로 답하는 패러다임이 계속 존재해야 할 이유를 알기 어렵다고 밝히며, 전화한 고객과 자연어로 대화하는 시스템을 만들고 싶어 이번 시범 프로젝트에 참여하게 되었다고 설명

▸ 제네시스는 이미 예측적 전화 라우팅 시스템을 개발한 바 있으며, 이번 프로젝트를 계기로 구글의 AI 솔루션과 매끄럽게 연동하는 방안을 모색하겠다는 입장

◾ 기조연설에서는 컨택트 센터 AI의 데모 영상이 소개되었는데, 소비자가 이베이에서 구매한 상품을 반품하기 위해 콜센터에 전화하는 상황을 설정한 데모임

▸ 데모 영상에서는 소비자가 콜센터에 전화하면 AI로 연결되며, AI는 인간처럼 자연스럽게 대화하며 소비자의 불만을 듣고 그 내용을 이해해 업무 처리를 마무리하였음

<자료> Genesys

[동영상] 콜센터 AI와 통화하는 반품 고객

▸ 구체적으로 살펴보면, 소비자가 테니스 운동화를 사고 싶었지만 잘못 구매했기 때문에 이를 반품 싶다고 하자, AI는 대화를 통해 소비자의 의도를 이해하고 제품 반품 프로세스를 실행하였음

▸ 이어 AI는 소비자가 테니스 운동화를 사고 싶다는 의도가 있음을 파악했기 때문에, 전화를 패션 담당 상담원에게 돌려주었고, 소비자는 상담원과 대화를 통해 원래 사고 싶었던 운동화를 구매할 수 있었음

▸ 이 데모 영상은 지능형 AI가 사람의 역할을 대신할 수 있다는 것 외에도, 상담원과 협조하여 콜센터 작업을 개선하려는 의도가 구현되어 있음을 보여주고 있음

◾ 컨택트 센터 AI에 통합된 인공지능 대화봇은 올해 초 ‘구글 I/O’에서 소개되어 논란을 불러 일으켰던 인공지능 가상 비서 ‘듀플렉스(Duplex)’와 유사한 기술이 적용되어 있음

▸ 올해 초 구글의 CEO 순다 피차이가 듀플렉스를 시연할 때 너무 사람과 똑같아. AI가 스스로 사람이 아니라 채팅봇임을 밝히지 않으면 대화 상대방이 사람으로 착각할 위험이 있다는 비난을 받는 등 한동안 논쟁의 벌어지기도 하였음

▸ 이런 논란을 의식해서인지, 컨텍트 센터 AI는 처음부터 자신이 컴퓨터임을 밝히고 인간의 톤으로 소비자와 대화를 시작하고 있음

▸ 거의 모든 콜센터에서는 트리 형식의 대화 모델로 질문하고 응답하면서 안내가 진행되지만, 컨택트 센터 AI는 개방 형식의 템플릿이 없는 대화 모델로 소비자와 대화하며 요구사항을 확인하고 소비자의 발언에 임기응변으로 대응하는 모습을 보여주었음

소비자: Unfortunately, they do not fit. So I need to return them.
(유감스럽게도 신발이 맞지 않네요. 반품해야겠어요.)

AI : I can help you that. I am starting a return for you. You will be receiving an email with the details of your return. (제가 도와드릴게요. 지금 반품 절차를 시작하고 있어요. 반품과 관련한 상세한 내용을 담은 메일을 받게 될 거에요)

AI : One more thing. Would you like me to connect to an eBay fashion expert to find the right shoes? (하나 더 말씀드릴 게 있는데요. 꼭 맞는 신발을 찾기 위해 이베이의 패션 전문가와 연결시켜 드려도 괜찮을까요?)

▸ 컨택트 센터의 AI는 소비자의 의도를 파악하여 대응하는 동시에 대화 정보를 기록하며, 고객의 요구와 이어지는 파생 요구를 추론해 적합한 직원에게 연결하는 기능도 수행함

▸ 데모 영상에서는 AI가 소비자에게 패션 담당 상담원과 통화해 보면 어떠냐는 제안을 하고, 고객이 응낙하면 전문 상담원에게 연결해 주는데, 연결이 되고 나면 상담원의 화면에 소비자와 AI의 대화가 표시되어 상담원은 지금까지의 경위를 바로 이해할 수 있음

▸ AI와 상담원의 협업은 여기서 끝나는 것이 아닌데, 상담원이 소비자와 대화를 진행하면 AI는 대화를 실시간으로 분석해 소비자의 의도를 파악하고 최적의 상품을 상담원에게 추천하는 기능까지 수행함

▸ 데모 영상에서 AI는 하드 코트 테니스화를 추천했고, 상담원이 이를 소비자에게 권하자 소비자가 수락해 구입함으로써 일련의 트랜잭션이 종료되는 모습을 보여주었음

<자료> Google

[그림 2] 상담원에게 제품을 추천하는 AI

◾ 이러한 컨택트 센터 AI 서비스는 ‘구글 클라우드’의 콜센터 시스템에서 실행되며, 클라우드에는 두 가지 유형의 AI가 순차적으로 작동하게 됨

▸ 이베이가 시험적으로 운영 중인 서비스는 구글 클라우드에서 실행되는 제너시스의 콜센터 시스템을 통해 구현되는데, ‘인공지능 가상 에이전트(AI Virtual Agent)’가 소비자와 자연어로 대화하며 클레임을 처리하고 상담원에게 전화를 돌려주는 기능을 함

▸ 전화를 돌려받은 상담원이 소비자와 통화할 때는 또 다른 인공지능인 ‘에이전트 어시스트(Agent Assist)’가 대화를 실시간으로 분석하고 추천 제품을 화면에 디스플레이 해 주는 기능을 수행함

▸ 컨택트 센터 AI는 기존 콜센터 시스템과 통합하여 이용되는데, AI가 쌍방향 음성 대응 기능(Interactive Voice Response)을 주관하여 콜센터의 두뇌 역할을 하게 됨

<자료> Google

[그림 3] 컨택트 센터 AI 서비스 구성도

▸ 기조연설의 데모에서는 제너시스의 솔루션이 사용되었지만, 이 밖에도 미텔(Mitel), 시스코Cisco), 트윌리오(Twilio) 등 주요 콜센터 시스템에서도 컨택트 센터 AI를 연계하여 사용할 수 있다고 함

▸ 각 솔루션의 구글 AI 지원 정도에 따라 서비스 연계 품질이 달라질 수 있겠지만, 기업들로서는 기존 콜센터 시스템을 전면 교체하지 않고도 컨택트 센터 AI를 통해 콜센터 상담원들의 업무를 효율화하는 동시에 고객의 만족도를 높일 수 있다는 것임

▸ 컨택트 센터 AI 서비스는 아직 안정화 단계는 아니지만, 사용을 희망하는 기업들은 구글 클라우드에서 서비스에 가입해 이용할 수 있음

▸ 컨택트 센터 AI 솔루션은 작년 11월에 공개된 대화형 에이전트 개발 스위트 ‘ DEE(Dialogflow Enterprise Edition)’를 기반으로 하며, 다이얼로그플로우 폰 게이트웨이를 활용해 전화 통신 네트워크와 통합이 가능한 딥마인드의 웨이브넷으로 강화되었음

▸ 웨이브넷(WaveNet)은 알파고를 개발한 구글의 자회사 딥마인드가 개발해 2016년에 발표한 오디오 원음 심층 생성 모델임

▸ 웨이브넷은 인간의 음성을 모방해 기계 음성을 생성해 주는데, 딥마인드는 기존 텍스트-투-스피치(TTS) 시스템들보다 더 자연스러운 기계음 생성을 목표로, 인간 음성과 기계음의 차이를 50% 이상 줄이는 기능을 연구 중이라고 함

◾ 컨택트 센터 AI는 듀플렉스와 유사한 기술이기는 하지만 기술의 스택과 목표는 듀플렉스와 다르며, AI와 사람의 협력을 강조하는 기업용 솔루션 시장을 타게팅하고 있음

▸ 구글이 올 초 대화형 AI 듀플렉스를 공개했을 때, 이용자를 대신해 레스토랑의 점원과 대화하며 테이블을 예약하는 시연 영상에 환호를 보낸 이도 많았지만 불편함을 두려움을 표출한 사람도 많았음

▸ AI의 말투가 사람과 구별할 수 없을 정도로 흡사한 데 대해 경악의 목소리가 내며, 도대체 AI를 이 정도 수준까지 인간에 접근시켜 할 필요성이 과연 있는지에 대한 사회적 논의가 벌어지고 있기도 함

▸ 이번 구글 클라우드 넥스트에서 공개된 시연 영상에서 컨택트 센터 AI의 가상 에이전트가 처음부터 자신이 사람이 아닌 가상의 존재임을 밝힌 것은, 구글이 듀플렉스 발표 이후 벌어지고 있는 논쟁을 의식하고 어느 정도 비판을 수용한 것이라 볼 수 있음

▸ 구글에 따르면 컨택트 센터 AI는 완전히 듀플렉스 기반 기술이라 보기는 어려운데, 두 기술이 기본적인 구성 요소를 공유하지만 기술 스택과 전반적인 목표가 다르기 때문

▸ 듀플렉스가 일반 사용자 경험의 향상을 목표로 하고 있고 사용 방식을 아직 정하지 못하고 있는 기술이라면, 컨택트 센터 AI는 기업에 초점을 둔 것으로 구글 클라우드의 데이터 프라이버시와 거버넌스 정책을 준수하고 있어 기업에서 바로 사용할 수 있는 기술임

◾ 구글은 컨택트 센터 AI가 인간의 일자리를 빼앗는 것이 아니라 인간을 도와주는 솔루션임을 강조하고 있지만, 실제로 기업이 어떻게 활용할 것인지는 당분간 관망이 필요한 부분

▸ AI를 접목한 콜센터 솔루션 부문에서는 IBM이 기존 솔루션에 왓슨(Watson)을 접목하며 앞서가고 있었지만, 구글이 자신들의 강점인 AI를 앞세워 지능형 기능을 강화하며 도전장을 내밈에 따라 이 부문 경쟁이 본격화될 전망

▸ 구글은 이번 발표회에서 각 기업이 자신들의 요구에 맞는 독자적인 AI를 개발할 수 있는 도구도 공개해 업무 형태에 따라 다양한 AI 콜센터를 구성할 수 있게 하였음

▸ 페이페이 리는 AI와 인간의 협력을 강조하며, 반복적이거나 간단한 작업을 AI에 맡기면 사람은 보다 지능적인 업무에 전념할 수 있다는 설명을 반복하였음

▸ 이 서비스는 ‘인간의 재능을 고양(Elevating Human Talent)’ 시키는 것으로, 컨택트 센터 AI가 상담원들의 일자리를 빼앗는 존재가 아님을 강조한 것

▸ 그러나 콜센터를 운영하는 기업들이 데모 영상에 소개된 AI의 기능 정도만으로도 만족할 수도 있고, AI 성능의 향상에 따라 다양한 캐릭터의 에이전트가 사람보다 더 대응을 잘한다고 평가할 수도 있어 구글의 희망대로 기업들이 움직일 지는 두고 보아야 할 것임

▸ 구글이 컨택트 센터 AI로 인해 상담원의 일자리가 영향을 받지 않을 것이라고 강조하는 것은 역설적으로 그 만큼 빼앗을 위험이 크다는 것의 방증일 수도 있음

◾ 한편 컨택트 센터 AI의 서비스가 시작된 만큼, AI와 사람의 상호작용이 어떤 수준, 어떤 방식으로 되는 것이 좋을지에 대한 사회적 합의를 도출하는 데도 도움을 줄 것으로 보임

▸ 듀플렉스가 공개되었을 때 일각에서 AI가 너무 사람과 흡사하다며 불편한 감정을 표출한 것은 소위 ‘언캐니 밸리(uncanny valley)' 현상으로 설명할 수 있음

▸ 언캐니 밸리는 로보틱스 이론 중 인간이 로봇에 느끼는 감정과 관련된 것인데, 1970년 일본의 로봇 공학자 모리 마사히로가 주장한 이론으로, 처음에는 로봇이 인간과 닮을수록 호감을 느끼다가 인간과 정말 비슷해지면 갑자기 깊은 두려움을 느끼게 되는 현상임

▸ 듀플렉스가 인간처럼 느껴진 이유는 사람들이 말을 할 때 나오는 좋지 않은 버릇, 소위 ‘disfluencies(눌변, 말더듬)’을 도입하고 있기 때문인데, ‘음...’ 또는 ‘에~’와 같이 의미 없는 중간 말을 대화중에 배치함으로써 인간미를 자아낸 것임

▸ 이를 불편하게 여기는 사람들은 듀플렉스가 인간을 모방할 필요는 없으며, AI라면 AI 답게 어색하게 말하라는 비판을 제기하고 있음

<자료> The Robot Report

[그림 6] 휴머노이드 로봇의 언캐니 밸리 효과

▸ 이에 대해 구글은 듀플렉스를 인간과 흡사하게 만들려고 한 이유는 AI가 어색하게 말하면 듣는 사람이 짜증이 나 전화를 끊어 버리는 일이 많기 때문이라 설명하고 있는데, 기계음에 짜증내던 사람도 듀플렉스의 발랄한 여성 목소리에는 친근감을 느낀다고 함

▸ 이용자를 대신해 AI가 레스토랑이나 미용실의 예약을 대행하는 듀플렉스와 달리, 콜센터의 AI는 무언가 문제를 가진 사람을 AI가 대응하는 것이므로, 사람이 AI에 대해 느끼는 감정이나 사람과 AI 사이의 상호작용은 보다 섬세하게 접근할 필요가 있을 것임

▸ 불만을 가진 사람들은 사람들을 대응하는 것이므로 기계가 아닌 사람인 것처럼 대응하는 것이 유리할 수도 있지만, AI가 100% 완전하게 대응이 불가능할 경우 짜증이 더 커질 것이므로 컨택트 센터 AI는 일단 채팅봇임을 밝히고 대화를 시작한 것이라 볼 수 있음

▸ 언캐니 밸리는 문자 그대로 해석하면 ‘불편함의 계곡’을 의미하며, 계곡에서 빠져나오지 못하면 더 이상 발전할 수 없다는 뜻을 내포하고 있음

▸ AI가 보다 일상화되기 위해서는 AI가 적용되는 각 상황 맥락에서 사람과 어떤 방식으로 상호작용할 것인지를 영리하게 정립할 필요가 있으며, 컨택트 센터 AI와 같은 응용 사례가 늘어나면서 사회적 합의점을 찾아나갈 수 있을 것임

저작자표시 비영리 동일조건

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

전세계 디지털 혁신 공급망을 꿈꾸는 캐나다의 AI 수퍼클러스터 (0)	2018.08.31
페이스북, 실생활에서 상식을 익히고 사람의 말을 이해하는 AI 개발 (0)	2018.08.23
오픈AI, 위화감 없이 두 얼굴을 합성해 주는 ‘글로우’ 기술 발표 (0)	2018.07.18
다음에 쓸 문장을 자동으로 알려주는 G메일의 새로운 AI 기능 (0)	2018.07.18
구글 액션 카메라 ‘클립스’, 사진작가 기술 습득한 AI가 자동 촬영 (0)	2018.07.12

오픈AI, 위화감 없이 두 얼굴을 합성해 주는 ‘글로우’ 기술 발표

주간기술동향 최신ICT이슈/인공지능(AI) 2018. 7. 18. 10:33 Posted by Purple Frog

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1855호(2018. 7. 18. 발행)에 기고한 원고입니다.

▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

오픈AI, 위화감 없이 두 얼굴을 합성해 주는 ‘글로우’ 기술 발표.pdf

◾ 인공지능 관련 비영리 연구기관으로 설립된 ‘오픈AI(OpenAI)’는 위화감 없이 두 얼굴 사진을 합성할 수 있는 기술인 ‘Glow(글로우)’를 발표

▸ 오픈AI의 연구원인 프라풀라 다리왈과 더크 킹마에 의해 개발된 글로우는 ‘가역 1×1 중첩(invertible 1x1 convolutions)’ 기술을 이용하는 이미지 생성 인공지능임

▸ 글로우는 두 사진을 합성할뿐더러 합성의 정도를 조절할 수 있는데, 가령 왼쪽 입력 창에 천체 물리학자 닐 디그래스 타이슨의 얼굴을 넣고, 오른쪽 입력 i창에 여배우 라시다 리 존스의 얼굴을 넣은 뒤 어느 쪽을 많이 반영할 것인지 조작할 수 있음

Glow: Better Reversible Generative Models

(클릭하면 링크 사이트에서 두 얼굴 합성을 체험해 볼 수 있습니다)

▸ 합성 창의 MIX 버튼 위치를 중앙 위치로 설정하면 두 사진 이미지를 균일하게 합성하게 되는데, 결과는 실재 인물일 것 같은 자연스러운 남성의 얼굴이 생성됨

▸ MIX 조절 버튼을 왼쪽으로 옮기게 되면 결과 값은 왼쪽 입력 창에 있는 디그래스 타이슨의 특징이 더 강하게 반영하지만, 이 역시 MIX가 중앙일 때 나온 것과 마찬가지로 상당히 자연스러운 느낌을 줌

▸ MIX 조절 버튼을 오른쪽으로 옮기면 당연히 리 존스의 얼굴 특징이 더 많이 반영되며, 결과 값은 약간 중성적 느낌이 나는 여성의 사진을 생성함

▸ 오픈AI는 글로우를 ‘더 나은 가역적 생성 모델(better reversible generative model)'이라 설명하고 있는데, 한쪽 이미지와 다른 한쪽의 이미지 사이를 쉽게 오가며 다양한 합성 이미지를 생성할 수 있다는 뜻을 담고 있음

<자료> OpenAI Blog

[그림 1] 글로우를 이용한 두 사진의 다양한 합성

◾ 글로우는 얼굴 사진의 합성 외에도 사진에 ‘나이, 수염, 미소’ 등의 속성을 추가하여 이미지를 자연스럽게 변화시키는 기능도 제공함

<자료> Fast Company

[그림 2] 얼굴 속성 값의 변화

▸ 글로우는 학습한 이미지를 토대로 자동으로 레이블을 붙일 수 있는 것도 특징인데, 데모용으로 준비된 3만 명의 얼굴 사진을 학습시키면 자동으로 ‘미소, 나이, 가는 눈, 금발, 수염’ 등의 레이블을 설정함

▸ 자동으로 설정된 레이블은 나중에 자유롭게 조작할 수 있으며, 새로 입력된 이미지에 속성 변화를 추가할 수 있음

▸ 가령 왼쪽 입력 창에 유명 AI 연구자인 제프리 힌튼의 얼굴 사진을 세팅하고, ‘웃음-나이-금발-턱수염’ 등의 속성 값을 최대로 하고, ‘가는 눈’ 속성 값을 최대로 하면(눈 크게 뜨기 설정), 오른쪽의 출력 창에 설정을 반영한 변경된 사진이 생성됨

▸ 수염이 검은 것이 약간의 위화감을 주기는 하지만, 실재한다고 해도 이상하지 않은 남성의 얼굴이 생성되며 AI가 독자적으로 판단해 만들어 낸 것 같은 느낌은 주지 않음

◾ 오픈AI는 글로우를 깃허브(GitHub)에 공개해 누구나 자유롭게 사용해 보도록 하고 있음(https://github.com/openai/glow)

▸ 글로우를 동작시키기 위해는 기계학습 오픈소스 라이브러리인 텐서플로우(TensorFlow)와 우버가 만든 텐서플로우용 오픈소스 분산 딥러닝 프레임워크인 호로보드(Horovod)가 필요하며, 구체적인 조작 방법 등은 글로우 문서에 설명되어 있음

▸ 문서는 ‘https://d4mucfpksywv.cloudfront.net/research-covers/glow/paper/glow.pdf’에서 다운로드 받을 수 있음

▸ 두 연구원은 한 사진에서 다른 사진으로 넘어가는 도중의 변환 이미지 완성도에 대해 ‘부자연스러운 합성이 보인다’며, 보다 자연스러운 변화를 주기 위해 자동회귀모형(autoregressive model)과 VAE 기법을 사용해 개선하고 싶다는 뜻을 밝히고 있음

▸ VAE(Variational Autoencode, 변동 자동 인코딩)는 딥러닝 모델 중 하나로, 학습 데이터를 바탕으로 그 특징을 파악하여 학습한 데이터 세트와 비슷한 데이터를 생성할 수 있음

저작자표시 비영리 동일조건

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

페이스북, 실생활에서 상식을 익히고 사람의 말을 이해하는 AI 개발 (0)	2018.08.23
구글 ‘콜센터 AI’ 서비스 발표, 상담원과 AI의 협업 솔루션 강조 (0)	2018.08.17
다음에 쓸 문장을 자동으로 알려주는 G메일의 새로운 AI 기능 (0)	2018.07.18
구글 액션 카메라 ‘클립스’, 사진작가 기술 습득한 AI가 자동 촬영 (0)	2018.07.12
AI로 강화된 이미지 검색 기능 ‘구글 렌즈’의 가능성과 과제 (0)	2018.06.22

다음에 쓸 문장을 자동으로 알려주는 G메일의 새로운 AI 기능

주간기술동향 최신ICT이슈/인공지능(AI) 2018. 7. 18. 10:19 Posted by Purple Frog

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1855호(2018. 7. 18. 발행)에 기고한 원고입니다.

▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

다음에 쓸 문장을 자동으로 알려주는 G메일의 새로운 AI 기능.pdf

◾ 구글은 최근 지메일(Gmail)의 기능을 대폭 업그레이드했는데, 7월부터 정식 제공 중인 AI(인공지능)이 다음에 쓸 문장을 제안해주는 ‘스마트 컴포즈(Smart Compose)’가 대표적

▸ 사용자가 메일을 쓰기 시작하면 AI가 연속적으로 문구를 생성해 주므로, AI가 제안한 문장이 의도와 부합한다면 쓰기 시작하는 것만으로 문장을 완결할 수 있어 메일 작성 시간을 크게 단축시킬 수 있음

▸ 스마트 컴포즈는 이번 일반 공개에 앞서 작년부터 시험 버전으로 공개된 바 있는데, 사용법은 간단해서 지메일 작성 화면에서 문자를 입력하면 AI가 알아서 문구를 생성

<자료> How-To Geek

[그림 1] 지메일 스마트 컴포즈 기능

▸ 가령 ‘How’를 입력하면 AI는 ‘How are you doing?’이라는 문장을 생성하는데, AI가 제시하는 문구(이 경우 ‘are you doing?’ 부분)는 회색으로 표시되며 탭을 누르면 검은색으로 바뀌며 문장이 확정됨

▸ 사용자들의 평은 대체로 기대했던 것 이상으로 편리하다는 것인데, 메일을 쓰고 나면 AI가 생성한 문장들이 메일의 대부분을 차지하고 있음을 알 수 있다는 것임

▸ 상대방 이름은 AI가 이메일 주소를 보고 유추해 생성한다고 하며, 작성자의 주소 등의 문구는 AI가 사용자의 개인정보를 파악하여 자동으로 삽입한다고 하는데, 개인에 따라 불편한 감정이 들 수도 있지만 이는 편리함을 얻기 위해 지불해야 하는 대가임

◾ 메일의 인사말 워딩은 아주 다양하지만, AI는 이런 다양성을 학습하여 사용자의 의도가 명확히 판별되는 시점에서 문장을 완성하여 제시함

▸ AI는 다양한 인사말 서식을 학습하고 있는데, 가령 ‘Hope’를 입력하면 이어서 ‘all is well with you’라는 문장을 생성함

▸ 이 문구가 아닌 다른 표현을 쓰고자 하는 경우에는 탭을 누르지 않고 계속 쓰면 되는데, ‘Hope e’까지 타이핑을 하면 AI는 ‘everything is going well with you’라는 문장을 생성하며, ‘Hope w’로 타이핑 하면 ‘work is going well’을 생성함

<자료> Fast Company

[그림 2] 스마트 컴포즈의 인사말 생성

▸ 즉, 쓰고 싶은 문장에 대한 힌트만 입력하면 AI가 그 문장을 완결해준다는 것으로, 인사말의 변화는 다양하지만 스마트 컴포즈는 이런 다양성에도 충분히 대응하고 있음

▸ 스마트 컴포즈의 AI가 어느 정도 서식이 정해진 인사말과 맺음말 부분만 작성하는 것은 아니며, 메일에서 가장 중요한 중간 부문의 문장도 생성함

▸ 본문도 글을 쓰기 시작하면 AI가 의미를 헤아려 그 다음에 나오는 단어를 생성하는 것은 동일하지만, 조금 복잡한 내용의 메일이 되면 AI가 생성해 주는 부분은 적어짐

▸ 따라서 스마트 컴포즈의 기능은 아직 제한적이라 할 수 있는데, 이를 보완하여 AI가 작성할 수 있는 내용의 범위를 넓혀가는 것이 다음 목표가 될 것으로 보임

◾ 스마트 컴포즈를 뒷받침하고 있는 AI는 알고리즘 학습을 거듭하여 메일 생성 능력을 습득하는데, 이 AI는 ‘언어생성모델(Language Generation Model)’이라고 불림

▸ 언어생성모델은 입력된 문자열에서 다음 단어를 예측하는 것으로, 일반적으로 ‘ 시퀀스-투-시퀀스(Sequence to Sequence, Seq2Seq) 모델’로 분류됨

▸ 지메일은 언어생성모델로 ‘회귀신경망-언어 모델(Recurrent Neural Network-Language Model, RNN-LM)’을 사용하며, 동시에 단어들의 분포를 보고서 문서의 유형을 판단하는 ‘단어 가방 신경망(Neural Bag of Words, BoW)’ 기법을 사용함

▸ RNN-LM은 RNN(시간에 종속적인 신경망) 기반의 언어 모델로 언어 생성의 단골 기법인데, 구글의 번역 서비스인 ‘구글 신경망 기계 번역(Google Neural Machine Translation)’에서 RNN-LM을 사용하고 있음

▸ RNN-LM은 Encoder(인코더, 단어를 부합하여 응축) 과정과 Decoder(디코더, 부호에서 단어를 생성) 과정으로 구성되는데, 번역 모델에서는 어떤 언어를 인코더에 입력하면 디코더가 다른 언어로 번역해 주는 식으로 작동함

◾ 지메일이 RNN-LM과 BoW를 동시에 사용하는 것은 예측 정확도와 처리 시간 단축 사이의 균형점을 찾아 적절한 서비스를 제공하기 위해서임

▸ 지메일에 RNN-LM을 적용하면 알고리즘이 이메일의 문장을 생성하는데, 이 때 인코더에 입력되는 것은 메일 제목과 수신 메일(회신 메일을 쓸 경우)이며, 디코더는 이용자가 이메일을 작성함에 따라 이어지는 문구를 생성하게 됨

▸ RNN-LM은 예측 정확도는 높지만 대규모 연산이 발생하기 때문에 응답이 나오기까지 시간이 걸리는데, 이용자가 타이핑할 때마다 다음 문구를 생성해야 한다면 RNN-LM을 서비스에 사용할 수는 없음

▸ 이 때문에 지메일은 RNN-LM과 BoW를 함께 사용하는데, BoW도 언어 모델의 하나로 말의 순서에서 다음에 나타나는 단어를 예측함

▸ BoW에서 단어는 위치 정보를 포함하는 벡터로 표현되며 ‘워드 임베딩(Word Embedding)’이라고도 하는데, 지메일은 메일 제목과 수신 메일을 인코딩할 때 이 워드 임베딩을 사용함

▸ RNN-LM의 디코딩의 각 단계에서 워드 임베딩을 입력하면 디코더가 텍스트를 생성하는데, 가령 ‘How’를 입력하면 RNN-LM은 ‘are you doing?’이라는 문장을 생성함

▸ 이처럼 RNN-LM의 인코딩 부분에 가벼운 BoW를 사용함으로써 지메일은 후속 문장 생성 연산으로 인해 발생하는 지연시간을 단축하는 데 성공했음

<자료> Google

[그림 3] 스마트 컴포즈 AI의 언어생성모델인 RNN-LM

◾ 지메일의 스마트 컴포즈는 기존 문장 자동 완성 서비스에 비해 지능적이고, 앞으로도 계속 기능이 보강될 예정이어서 이용이 점차 확산될 것으로 예상됨

▸ 마이크로소프트 아웃룩에서도 메일을 작성하거나 워드에서 글을 쓸 때 창에 문장 후보가 제시되기는 하며, 이를 잘 사용하면 문장을 효율적으로 쓸 수 있음

▸ 그러나 이 기능은 언어 입력 변환의 경우, 즉 한글을 영어로 변환하는 경우에 사용할 수 있는 문자 변환 기능이어서 이용 범위가 제한되며, 무엇보다 변환의 정확도가 낮아 실망스러운 경우가 적지 않음

▸ 이에 비해 지메일의 스마트 컴포즈는 입력된 문자나 단어에 반응하여 이어지는 문장을 생성해 주는 것이므로 보다 지능형 기능이라 부를 만함

▸ 스마트 컴포즈는 이제 막 선보이 기능으로 앞으로 계속 보완되어 갈 것이며, 구글에 따르면 현재 이용자의 문체로 문장을 생성하는 알고리즘이 개발되고 있다고 함

저작자표시 비영리 동일조건

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

구글 ‘콜센터 AI’ 서비스 발표, 상담원과 AI의 협업 솔루션 강조 (0)	2018.08.17
오픈AI, 위화감 없이 두 얼굴을 합성해 주는 ‘글로우’ 기술 발표 (0)	2018.07.18
구글 액션 카메라 ‘클립스’, 사진작가 기술 습득한 AI가 자동 촬영 (0)	2018.07.12
AI로 강화된 이미지 검색 기능 ‘구글 렌즈’의 가능성과 과제 (0)	2018.06.22
상용화 단계에 다다르고 있는 AI 이용 ‘마인드 리딩’ 기술 (0)	2018.05.24

«이전 1 2 3 4 ··· 6 다음»

보라빛 소를 만나기 위한 도약

카테고리

Search

'주간기술동향 최신ICT이슈/인공지능(AI)'에 해당되는 글 53건

IBM 100만 명 얼굴 정보 담은 데이터셋 공개, 인식의 공정성이 목표

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

페이스북, 사진의 특정 부분을 터치하면 AI가 상황을 설명해주는 서비스

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

페이스북, AI로 소프트웨어 버그 수정하는 SapFix 시스템 공개

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

웨더뉴스-엔비디아, AI 이용한 전세계 강우 상황 가시화 프로젝트

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

싱가포르 정부,‘AI 거버넌스 프레임워크’ 구축의 방법론 제시

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

전세계 디지털 혁신 공급망을 꿈꾸는 캐나다의 AI 수퍼클러스터

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

페이스북, 실생활에서 상식을 익히고 사람의 말을 이해하는 AI 개발

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

구글 ‘콜센터 AI’ 서비스 발표, 상담원과 AI의 협업 솔루션 강조

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

오픈AI, 위화감 없이 두 얼굴을 합성해 주는 ‘글로우’ 기술 발표

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

다음에 쓸 문장을 자동으로 알려주는 G메일의 새로운 AI 기능

'주간기술동향 최신ICT이슈 > 인공지능(AI)' 카테고리의 다른 글

tag cloud

공지사항

최근댓글

최근기사

글보관함

링크

티스토리툴바

« 2025/4 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30