※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1836호(2018. 3. 7. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

구글 자율운전차의 강력한 대항마로 부상한 GM의 ‘크루즈 AV’.pdf



[ 요 약 ]


제너럴 모터스(GM)는 2019년 양산을 목표로 완전 자율주행 자동차 크루즈 AV(Cruise AV)의 개발과 테스트에 박차를 가하고 있음크루즈 AV는 자율주행차 기술을 선도하고 있는 구글 웨이모(Waymo)를 겨냥해 대항마로 개발 중인 모델임. IT 대기업과 스타트업들이 각광받고 있는 자율운전 개발 경쟁에서 GM은 그 동안 존재감이 없었으나전문가들은 크루즈 AV가 GM은 흘러간 과거의 거인이라는 낙인을 지울 만큼 상당한 실력을 품고 있는 것으로 보고 있음



[ 본 문 ]


ž 제네럴 모터스(GM)2018 1월 미국 교통부(DOT)운전대와 페달이 없는 자율운전 자동차의 도로 주행 허가 신청서를 제출하였음


Ø 신청서에 따르면 조작부가 없는 GM 차량의 자율운전 수준은 미국 자동차기술협회(SAE)가 정의한 6단계 중 5단계인 레벨 4'에 해당하는 것으로 보이며, 제한된 조건에서 완전 자율운전의 실현을 테스트 하려는 것으로 보임


<자료> General Motors


[그림 1] 무인차량 크루즈 AV의 내부


Ø GM이 내건 조건 중 하나는 주행 지역을 좁힌다는 것인데, 고정밀 지도 데이터가 구축되어 있고 실제 차량 테스트와 분석에 의한 시뮬레이션 주행 시험을 반복해 왔던 이미 잘 알고 있는 지역에서만 주행하겠다고 밝혔음


Ø GM 2019년에 자율운전 차량의 양산을 시작한다는 계획인데, 양산 초기 판매 모델은 웨이모(Waymo)와 비슷한 형태, 즉 차량 공유나 카풀 등 배차 서비스 기업들의 업무 차량으로 공급될 예정임


ž GM은 크루즈 AV가 배차 서비스와 결합될 경우, 보다 많은 사람들이 자율운전 차량을 경험함으로써 이해도가 높아질 것으로 기대한다는 입장을 밝히고 있음


Ø 크루즈 AV가 배차 서비스에 이용될 경우 사용자는 스마트폰으로 무인 차량을 호출하게 되고, 승차지는 목적지는 제한된 범위 내에서 선택하는 형태가 될 것으로 보임


Ø 웨이모에 이어 GM도 배차 서비스를 우선 타게팅 하는 것은 미국에서 배차 서비스 이용자가 급격한 증가하고 있기 때문으로, 서비스 업체 입장에서는 크루즈 AV를 배차 서비스와 조합하며 운전자 확보 없이도 이용자를 쉽게 늘릴 수 있는 이점이 있음


Ø 또한 GM에 따르면 배차 서비스에 크루즈 AV를 공급할 경우 불특정 다수의 사람이 탑승할 기회를 갖게 되므로, 보다 많은 사람들이 자율운전 기술에 대해 직접 경험하고 안정성과 편의성을 판단할 수 있게 되는 마케팅 효과를 기대할 수 있음


ž 배차 서비스에 크루즈 AV를 우선 공급하는 것이 자동차를 최대한 팔아야 하는 GM에 손해가 될 수도 있으나, 신차 시장이 줄어드는 상황에 적극 대응하기 위한 것으로 보임


Ø 크루즈 AV은 부품 비용이 동급 엔진의 차량 모델에 비해 수천만 원은 높기 때문에 판매가가 높을 수밖에 없으며, 따라서 개인에 판매할 경우 살 수 있는 고객의 수는 제한됨


Ø 부품 가격이 높은 이유는 크루즈 AV에 탑재하는 주요 환경 인식 센서의 수 42개에 이르고 고성능 컴퓨터도 여러 대 탑재되기 때문


Ø 또한 운동제어부의 부품 모두 어느 한 계통이 고장 나도 정상적으로 주행할 수 있는 기능안전(Fail Operational) 방식으로 되어 있어 부품 수가 크게 늘어나기 때문


Ø 게다가 크루즈 AV는 쉐보레(Chevrolet) 브랜드의 전기자동차 볼트(Bolt)를 기반으로 개발 중인데, 볼트는 소형차이지만 고가의 대용량 배터리를 탑재하고 있어 판매 가격이 유사 차종에 비해 약 3 7천 달러 가량 높은 편임


<자료> General Motors


[그림 2] 볼트 EV 기반의 크루즈 AV


Ø 크루즈 AV의 가격이 개인이 구매하기엔 부담스럽지만, 배차 서비스 업체라면 운전자 인건비가 들지 않고 가동 시간을 늘릴 수 있는 장점을 기대할 수 있어 추가 매입 가격이 얼마나 단기간에 회수될 지는 두고 봐야 하지만 수요는 있다는 평가


Ø GM 입장에서는 배차 서비스 업체에 차량을 판매하는 것이 개인들에게 판매하는 것에 비해 손해이지만, 당장은 개인 수요가 불투명해 배차 서비스 업계에 마진을 낮추더라도 대량으로 공급하는 전략을 택할 것이란 게 자동차 산업 애널리스트들의 전망임



Ø 한편 이윤이 낮아짐에도 GM이 배차 서비스용 무인 차량을 우선 개발하는 것은 배차 서비스로 인해 향후 미국의 신차 시장이 줄어들 것으로 전망되기 있기 때문이란 분석도 있음


Ø KPMG에 따르면 2030년 미국의 신차 판매 대수는 1,620만 대로 2016년에 비해 130만 대가 줄어들 것으로 예측했는데, 내역을 보면 배차 서비스 등과 결합된 무인 차량이 300만대 규모로 성장하는 반면 세단 등 개인 소유 차량은 약 420만 대로 크게 줄어든 전망


Ø 만약 예측대로 시작이 변해간다면 개인 대상 판매가 중심인 GM 등 자동차 업체에 타격이 클 것이며, 게다가 웨이모를 비롯한 IT 대기업들이 새롭게 성장하는 시장을 선점할 것이기 때문에, GM으로서는 무인 택시 개발이 공격인 동시에 방어 전략인 측면이 있음


<자료> KMPG


[그림 3] 2030년 미국 신차 시장 전망


ž 구글 등에 가려져 잘 알려지지 않았지만 GM의 자율운전차 연구개발의 역사는 오래 되었으며, 자동차 업계에서는 자율운전 연구의 선구자로 인정받고 있음


Ø 80년 전인 1939년 뉴욕 국제 박람회에서 GMFuturama(퓨처라마)라는 제목의 세밀한 디오라마 연출을 통해 고속도로를 자동으로 달리는 자동차의 미래 이미지를 선보인 바 있는데, 자율주행이 IT 기업에 의해 제시된 개념은 아님을 엿볼 수 있음



Ø 비교적 최근에도 자율운전 기술의 전환점에 GM이 밀접한 관련이 있는데, 치열한 기술 경쟁의 계기가 된 2007DARPA(방위고등연구계획국) 개최 자율운전차 경주 대회에서 우승 한 카네기 멜론 대학에 차량을 제공하고 개발을 도운 곳이 GM이었음


Ø 그러나 당시 카네기 멜론 팀의 개발 리더였던 크리스 우름슨은 대회 종료 후 구글에 들어가는데, GM도 초빙했다고 하나 구글에 납치되다시피 했다는 후문이며, 이런 배경을 놓고 보면 GM에게 구글은 악연의 적수라 할 수 있음


ž GM은 크루즈 AV의 개발에 있어 안전성과 신뢰성을 중시하고 있음을 강조하고 있는데, 자동차 양산 경험이 없는 웨이모와 차이를 가장 잘 보여줄 수 있는 지점으로 보기 때문


Ø GM은 크루즈 AV 1983년 설립된 미시간주 오리온 공장에서 양산할 계획인데, 수십 년에 걸쳐 발전시켜 온 설비 및 공정을 통해 생산함으로써, 자체 자동차 공장이 없는 웨이모 등 ICT 기반 신흥 자동차 업체들과 차별성을 보여준다는 전략임


Ø 실제 안전성과 신뢰성은 자율운전 자동차의 판매에서 가장 중요한 요소가 될 가능성이 높은데, 가트너의 2017년 설문 조사에서 55%의 응답자가 기술적인 결함에 대한 불안을 이유로 자율운전 자동차를 타고 싶지 않다고 답했음


Ø 이는 자동차의 안전성이 곧 생명과 직결되기 때문으로, 향후 안전성과 신뢰성에 관해 소비자의 마음을 얻을 수 있는지 여부가 자율운전 차량의 매출을 크게 좌우할 것임을 시사


Ø GM은 개발 방식에 있어서도 웨이모에 비해 안전성과 신뢰성에서 우위에 있다고 어필하고 있는데, 하드웨어와 소프트웨어를 모두 자사에서 개발한다는 것을 근거로 들고 있음


Ø GM과 달리 현재 웨이모는 분업 체계를 선택하여, 웨이모가 소프트웨어를 담당하고 파트너인 미국 피아트·크라이슬러·오토모빌스(FCA)가 차량의 개발과 생산을 담당하고 있음


Ø 이에 대해 GM은 방대한 소프트웨어와 수만 개 부품의 하드웨어로 구성되는 자율운전 차량의 특성상, 분업은 신뢰성 높은 시스템의 개발과 평가를 원활하게 진행하기가 어려운 방식이라 주장하고 있음


Ø GM 2016년에 자율운전 소프트웨어를 개발업체인 크루즈 오토메이션(Cruise Automation)을 약 10억 달러에 인수해 GM 내부로 포섭한 바 있음


Ø 이를 통해 하드웨어와 소프트웨어 팀 간의 긴밀한 협력을 통해 모든 시스템의 잠재적인 고장 패턴을 분석하여 안전하고 신뢰할 수 있는 무인 자동차를 생산할 수 있게 되었다는 것을 자신들의 장점으로 어필하고 있음


ž 주행 성능 면에서도 GM은 웨이모에 대해 우위라고 은근히 주장하는데, 2019년에 시작할 배차 서비스를 주행 환경이 복잡한 도심에서 시작할 것임을 내비치고 있기 때문


Ø 웨이모는 2018년부터 애리조나주 피닉스의 교외 지역에서 무인 차량을 이용한 배차 서비스를 정식 시작할 계획인데, 피닉스는 도심에 비해 교통량이 적고 도로 정비가 잘돼 있기 때문에 사고가 일어날 가능성은 상대적으로 낮은 지역이라 할 수 있음


Ø GM은 상용화 시점은 웨이모에 비해 늦었지만 교외에서 서비스를 하는 웨이모에 비해 주행 성능은 자신들이 뛰어나다는 것을 보여주려 하고 있음


Ø GM은 도로 주행 시험 허가 신청서와 함께 공개한 자료(☞클릭) 를 통해 도심인 캘리포니아주 샌프란시스코와 교외 지역인 피닉스 근교의 교통 환경이 어떻게 차이 나는지를 의도적으로 강조하였음


Ø 긴급 차량의 운행대수나 좌우 회전 교차로의 수가 샌프란시스코에 훨씬 많다는 것을 강조한 것인데, 주행 환경이 쉬운 피닉스에서 서비스를 시작하는 웨이모를 강하게 의식한 것이 분명해 보임


Ø GM은 현재 샌프란시스코 이외에 미시간주 디트로이트에서 도로 주행 테스트를 하고 있는데, 향후 대도시 뉴욕에서도 테스트를 시작할 예정이며, 도심 중심의 주행 테스트에 주력함으로써 웨이모를 추격한다는 전략임


[1] GM과 웨이모의 자율주행 테스트 환경의 비교(자율주행 1천 마일 당 빈도)

운행 조작/시나리오

샌프란시스코(GM)

피닉스 교외(웨이모)

비율

좌회전

1,462

919

1.6:1

차선 변경

772

143

5.4:1

공사로 인한 차단 차선

184

10

19.1:1

반대편 차선을 이용한 통행

422

17

24.3:1

공사 현장 주행

152

4

39.4:1

응급 차량

270

6

46.6:1

<자료> General Motors


Ø 반면 GM은 자율주행 테스트 총 주행거리를 밝히고 있지는 않은데, 주행거리는 지금까지지 누적 400만 마일을 테스트한 웨이모가 자신들의 안전성과 신뢰성을 어필하는 요소로 강조하는 포인트이고, GM이 단기간에 따라잡기란 불가능하기 때문


ž GM의 기술에서 핵심 개념은 중복 설계(Redundancy)인데, 안전과 신뢰성을 위해 주요 기능의 구동이 실패한 경우에도 주행을 계속할 수 있는 구조를 갖추고 있음


Ø IT 시스템 구축에서 중복 설계(리던던시)는 비용을 높이더라도 무중단 가동 환경을 만드는 것인데, 트레이드-오프 관계에 있는 비용과 안전성의 두 요소를 놓고 GM은 자율운전차 판매에서 안전이 가장 중요하다고 생각해 비용을 높여 안전성을 선택한 것으로 보임


Ø GM에 따르면 크루즈 AV의 자율운전 시스템에는 인식(Perception)-주행 계획(Planning)-차량 제어(Control)의 세 가지 주요 기능이 있는데, 모두 중복 설계 되었다고 함


Ø 예를 들어 인식 기능은 차량 주변 객체의 위치와 속도, 방향, 종류를 계산하는 것인데, 핵심은 차량 주위 360도를 인식하는 센서 군으로, 작동 원리가 다른 3 종류의 센서를 사용하는 것에 더해 동일한 장소를 복수의 센서로 감지하도록 중복 설계하였음


ž 크루즈 AV는 라이더(LIDAR, 적외선 레이저 센서) 5, 카메라 16, 밀리파 레이더 21개를 탑재했는데, 한 센서가 작동하지 않아도 다른 센서로 주위 360도 인식 기능을 유지함


<자료> GM


[그림 4] 크루즈 AV 지붕의 5대 라이더 센서


Ø 3종류의 센서 중 핵심은 라이더로, 라이더 하나 만으로도 안전하게 주행할 수 있는 기본 기능을 구현할 수 있는데, GM 2017 10월 라이더를 개발하는 스타트업 스트로브 (Strobe)를 인수하고 기술 고도화에 투자하고 있음


Ø 밀리파 레이더는 주로 이동하는 물체의 감지를 담당하며 라이더를 지원하는데, 전파의 반사에 의해 차량과 이동하는 객체의 상대 속도를 측정하는 데 강점이 있음


Ø 라이더와 밀리파 레이더는 각각 레이저()와 전파를 이용해 측정 원리가 다르기 때문에 레이저의 반사율이 낮은 경우 전파의 반사로 보충하는 보완 관계가 형성됨


Ø 카메라는 물체의 색상과 모양을 고화질로 감지 할 수 있어 거리와 속도를 감지하기 보다 주로 물체의 분류와 추적에 사용하지만, 여러 대의 카메라로 거리를 감지하는 기능을 갖출 수 있어 라이더가 구동하지 않을 경우 어느 정도 기능을 대체할 수 있음


Ø 인식 기능에는 센서 군에 의한 물체 감지 외에도 자기 위치 추정(Localization) 기능이 포함되는데, 이는 자율운전의 근간으로 만일 실패하여 추정의 정확도가 크게 떨어지면 자율운전이 불가능하므로 GM은 여러 방법으로 추정이 가능하도록 중복 설계하고 있음


Ø 가령 내비게이션 기능에서는 일반적인 GNSS(위성위치확인시스템)와 자이로 센서를 결합하는 방법과 라이더 등으로 측정한 특징물과 고정밀 지도 데이터의 위치를 ​​대조하는 방법 등을 동시에 이용해 자기 위치를 추정하고 있음


ž 인식 결과를 바탕으로 주행 계획을 수립하게 되며, 여기에서 중요한 것은 행동예측과 보이지 않는 영역에 대한 고려인데, GM은 이 기능에 딥러닝을 적용하였음


Ø 주행 계획에는 내비게이션과 마찬가지로 목적지까지의 경로를 계산하는 매크로 주행 경로 결정과 사고 확률을 줄이기 위한 마이크로 주행 경로 결정이 포함되는데, 최근 중요성이 강조되는 것은 마이크로 주행 경로 결정임


<자료> GM


[그림 5] 마이크로 주행 경로의 결정


Ø 마이크로 주행 계획은 우선 센서에서 인식한 주변 객체의 3 차원 모델을 구축해 정밀 지도 데이터에 가상으로 배치한 다음 객체의 종류와 속도 등의 계산 결과를 바탕으로 지도 데이터에서 객체 모델의 움직임을 예측하는 것임


Ø 차량과 보행자, 트럭, 자전거 등의 종류에 따라 움직이는 방법이 매우 다양하기 때문에 이를 고려하여 행동 예측에 반영시키게 됨


Ø 그런 다음 인식 기능으로 계산한 주행 한계의 결과와 조합하여 차량이 달릴 범위를 결정하게 되는데, 주행 가능 범위 내에서 사고의 위험이 낮고 빠르게 달릴 수 있는 경로를 그리고 그 경로에 따라 차량이 움직이도록 함


Ø 주행 한계의 계산은 인공지능(AI)의 일종인 딥러닝(심층 학습)을 사용하는데, 주행 한계는 일반적으로 흰색 선이나 가드 레일, 차도와 인도의 턱 등을 통해 쉽게 찾을 수 있음


Ø 그러나 외곽 도로의 경우 흰색 선이 없어 주행 한계를 이해하기 어려운 곳이 자주 나타나기 때문에, 주행 한계를 결정할 때 달릴 수 없는 영역으로 분류된 곳의 수 많은 이미지를 이용해 훈련시킨 AI의 판단이 효과를 발휘할 수 있음


Ø 주행 경로의 결정에서 GM은 특히 센서에 보이지 않는 영역의 처리를 위한 연구를 중요시하고 있는데, 비나 안개, 다른 객체에 가려 보이지 않는 영역을 파악하고 안전한 경로를 결정하는 데 연구 결과를 적용하고 있음


Ø 가령 지도 데이터의 보이지 않는 영역에 가상의 깃발(플래그)을 세우고, 그 깃발 지점에서 물체가 갑자기 튀어 나오는 위험을 계산한 후, 그 결과값을 가미하여 주행 경로를 신중하게 결정함으로써 운행의 안전도를 높이고 있음


ž 주행 계획의 계산에도 중복 설계를 하고 있는데, 경로 결정 대로 주행이 제대로 실행되지 않을 경우에 대비해 항상 여러 백업 경로를 준비해 두도록 하고 있음


Ø 크루즈 AV는 초당 10회 정도의 경로를 계산하여 이 중 가장 안전하고 빠르게 달릴 수 있는 경로 선택을 기본 원칙으로 하고 있음


Ø 그러나 예상대로 주행이 이루어지지 않을 때를 대비해, 가령 차선을 변경하는 경로를 선택했을 때 갑자기 다른 차가 변경하려는 주행 경로를 차단했을 때는 원래 차선으로 달리는 등 백업으로 준비하고 있던 경로로 즉각 전환하도록 하고 있음


Ø 주행 계획의 연산에는 통신(Networking) 기능도 활용되는데, 다른 크루즈 AV 차량이 인식한 정보를 경로 계획에 반영하는 것으로, 다른 차량이 인식한 정보를 클라우드로 통합한 후 네트워크를 통해 모든 크루즈 AV 차량이 공유하도록 하고 개발하고 있음


Ø GM은 이를 두고 한 대가 학습한 것을 모든 차량이 학습한다고 표현하는데, 일반 자동차에 없는 장점으로 크루즈 AV의 안전 운전에 크게 기여할 것으로 기대하고 있음


ž 차량 제어 기능은 주행 계획에 따라 가속과 감속, 조향을 제어하는 것인데, 차량 제어에 관련된 전기 계열 하드웨어 부품을 모두 이중화하였음


Ø 예를 들어 자율운전 기능의 주요 ECU(전자제어장치)를 두 개 탑재하는 것인데, 한 컴퓨터가 구동에 실패할 경우 동시에 계산하고 있던 다른 한쪽이 연산을 이어받게 됨


<자료> GM


[그림 6] 크루즈 AV 주요 배선의 이중화


Ø 이 때 2개의 ECU가 상호 감시하는 구조에서는 어느 쪽이 실패했는지 결정할 수 없기 때문에 GM ECU를 전체 시스템의 고장 유무를 항상 감시하는 자자가 진단 ECU를 또 하나 탑재하였음


Ø 이 진단 ECU가 있으면 다수결로 어떤 ECU가 실패했는지 결정할 수 있기 때문에, 실패한 ECU의 신호를 사용하지 않고 남아 있는 정상적인 ECU의 신호로 차량을 제어하게 됨


Ø 주요 기능의 전원 공급 장치 역시 2개의 계통을 준비하는데, 주 전원이 실패하면 백업 전원에서 주요 ECU와 인식 센서, 스티어링, 브레이크 등에 전력을 공급함


Ø 특히 브레이크에 대해서는 전용 카메라를 별도로 설치하여 일반적인 자율운전 기능 용도 이외에 자동 브레이크 기능을 추가로 탑재하고 있음


Ø 주요 ECU를 연결하는 신호선도 이중으로 하여 한쪽 통신이 끊어진 경우 다른 쪽으로 신호를 교환하도록 하고 있음


Ø 또한 확률은 낮지만 주요 부품과 백업 부품이 고장 나는 경우에 대비한 방안도 강구하고 있는데, 이 경우 페일 세이프(fail safe) 기능을 통해 안전하게 정지한다고 함


ž 크루즈 AV는 주행 계획 등에 통신 기능을 이용하고 있기 때문에, 무선 통신을 통해 해킹이 발생할 경우 중대 사고로 이어지게 되므로 GM은 보안 대책에도 주력하고 있음


Ø GM이 인수한 크루즈 오토메이션에는 자동차 업계의 화이트 해커로 가장 유명한 두 사람이 있는데, 찰리 밀러 (Chary Miller)와 크리스 발라섹(Chris Valasek)


Ø 이 둘은 2013년 도요타 프리우스를 해킹하여 주목을 받았으며, 이후 우버 등을 거쳐 크루즈 오토메이션에 일하던 중 GM의 인수로 현재는 크루즈 AV 보안 개발에 참여하고 있음


Ø 보안을 위해 GM은 소프트웨어의 취약점을 포괄적으로 분석하는 도구 및 잠재적인 위협을 업스트림(상위 공정)에서 발견하여 제거하는 위협 모델링 등을 활용 중이라고 하며, 통신에 메시지 인증 기능과 함께 침입 탐지 기능을 도입했다고 함


ž 웨이모가 크게 앞서는 듯 보이던 자율운전차 시장에 전통의 자동차 업체 GM이 강력한 대항마로 나섬에 따라 2018년 자율운전차 시장의 상용화 모멘텀은 더욱 커질 전망


Ø 웨이모는 주행거리를, GM은 주행환경의 난이도를 강조하는 것으로 나타나고 있으며, 서비스 업체와 소비자의 마음을 얻기 위한 양사의 경쟁 과정에서 기술의 발전과 소비자 인식 전환, 상용 서비스 완성도 제고가 극적으로 전개될 것으로 기대되고 있음

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1833호(2018. 2. 14. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

무인 점포 아마존 Go의 상품 구입 여부 인식 방법.pdf



ž 2018 1월부터 문을 연 아마존의 무인 점포 아마존 Go는 높은 편의성으로 호평을 받고 있는데, 구체적 작동 방식에 대해서는 아마존이 아직 공개하지 않고 있음


Ø 아마존 Go를 이용하려면 전용 앱이 필요하며, 매장에 들어갈 때 앱을 실행하고 표시된 QR 코드를 리더기에 비추면 게이트의 바가 열리게 됨



Ø 매장에 들어서면 사고 싶은 상품을 손으로 집어 바구니나 가방에 넣으면 되는데, 상품 개수가 손에 들고 있을 수도 있는데, 아마존 Go의 인공지능(AI)은 고객이 상품을 손으로 집어 든 시점에서 구매를 했다고 판정함


Ø 만일 마음이 바뀌어 고객이 제품을 선반에 되돌려 놓으면 AI는 이를 반품한 것으로 인식하며, 내려 놓은 시점에서 상품이 구매 목록에서 제거됨


Ø 계산대에 점원이 없기 때문에 쇼핑이 끝난 고객은 그대로 가게를 걸어 나오면 되며(Just Walk Out), 계산대의 AI가 고객이 구매한 아이템을 최종 파악해 전용 앱에 결제를 청구하고, 영수증이 앱에 표시되기 때문에 고객은 자신이 구입한 상품을 확인할 수 있음



Ø AI가 어떤 방법으로 구매 여부를 판정하는지에 대해 아마존은 자세히 공개하지 않고 있는데, 컴퓨터 비전(Computer Vision, 영상 분석)과 딥러닝 알고리즘, 센서 퓨전(Sensor Fusion, 서로 다른 여러 종류의 센서를 통합) 기술 등을 이용한다는 언급에 머물고 있음


ž 무인 계산대가 운영되려면 우선 고객과 고객이 집어 든 제품을 식별하는 기능이 필요한데, 컴퓨터 비전센서 퓨전 기술은 이 부분에서 사용되는 것으로 보임


Ø 매장 입구 게이트의 리더기에 앱의 QR 코드를 갖다 대면 시스템은 이용자를 파악할 수 있고, 그 다음엔 천장에 설치되어 있는 카메라가 이용자를 인식해 위치를 파악할 것인데, 이를 위해서는 고객 정보와 카메라가 파악한 정보를 연결해 주는 키 값이 필요함


<자료> Seattle Times

[그림 2] 아마존 Go 천정의 카메라


Ø 매장 안에서 고객이 이동할 때마다 천장에 설치된 카메라가 그 움직임을 추적하는데, AI가 이용자의 얼굴 인증을 실시하는 것은 아니므로, 고객의 모습에서 특징량을 파악하고 이를 키 값으로 사용해 고객을 추적하는 것으로 보임


Ø 천장에는 수많은 카메라가 설치되어 있으며 카메라는 상자 안에 탑재되어 있는데, 이 상자 안의 프로세서는 카메라가 포착한 이미지에 대한 기초적인 AI 분석을 수행할 것임


Ø 카메라는 사람의 형태를 인지하고 이용자를 식별 및 추적하며, 손을 뻗는 등 고객이 보이는 동작의 의미를 파악하는 기능을 수행하는데, 만일 고객이 다른 장소로 이동하면 다른 카메라가 이어 받아 계속 추적할 것임


Ø 천정의 카메라는 또한 선반의 상품을 인식하고 고객이 집어 든 상품의 이름을 식별하는 기능도 수행할 텐데, 상품 진열대에도 상품 식별을 위한 별도의 카메라가 설치되어 있음


Ø 겉으로 보이진 않지만 진열대에는 카메라와 저울이 탑재되어 있다고 하는데, 카메라는 소비자가 선택한 상품을 인식하며, 저울은 선반의 무게를 측정하여 무게가 줄어들면 상품이 구매된 것으로 인식하는 것으로 보임


Ø 이에 대해서는 무게 감소 여부로 파악하는 것이 아니라, 시스템에 각 상품의 무게를 입력해 놓음으로써 줄어든 무게에 따라 구매된 상품명을 식별하는 것이라 보는 의견도 있음



ž 컴퓨터 비전과 센서 퓨전을 통해 수집한 일련의 데이터는 서버로 전송되며, 최종적으로 딥러닝 알고리즘이 누가 얼마만큼의 상품이 구매되었는지 추정하는 것으로 보임


Ø 사람들의 쇼핑 패턴이 동일하다면 시스템이 누가 어떤 상품을 구매했는지 판단하기 용이할 것이나, 매장에서 쇼핑을 할 때는 다양한 상황이 발생하기 때문에, 시스템은 딥러닝의 방식으로 다양한 상황을 학습해 나갈 필요가 있음



Ø 가령 고객이 제품을 바구니에 넣었다가 이동하는 도중에 마음이 바뀔 때, 그것을 원래 자리에 갖다 놓기 보다는 아무 선반에나 올려 놓는 경우가 많음


Ø 또한 고객이 상품을 가방이나 바구니에 넣는 것이 아니라 동반한 아이에게 들고 가게 하는 경우도 있을 것이며, 들고 있던 상품을 다른 고객에게 전달하는 경우도 있을 것임


Ø 아마존 Go 앱에 따르면 현재 상품을 다른 사람에게 전달하는 행위는 금지되어 있는데, 알고리즘이 이러한 돌발 사태를 파악하고 적절하게 과금 청구할 수 있도록 딥러닝을 통해 훈련시킬 필요가 있을 것임


<자료> Android Police

[그림 3] 아마존 Go에서 불허되는 행위


ž 이렇게 보면 딥러닝 알고리즘을 교육시켜 고객을 인식하는 정확도를 높이고 소비자 행동의 의미를 학습시키는 과정이 아마존 Go의 성패를 좌우한다고 할 수 있음


Ø 딥러닝 알고리즘 교육을 위한 데이터 수집을 위해 아마존은 아마존 Go 오픈에 앞서 아마존닷컴 직원들을 대상으로 테스트를 실시했다고 함


Ø 아마존 Go2016 12월에 그 계획이 발표되었고 원래 2017년 초에 오픈을 목표로 했으나 실제로는 약 1년 후인 올해 1월로 크게 늦어졌는데, 그 이유가 정확히 공개되지 않았지만 매장이 북적일 때 AI가 매출을 정확히 판정할 수 없기 때문이었다는 말이 있음


Ø 아마존은 카메라의 대수를 늘려 판정 정확도를 향상시키는 방식을 택했는데, 바닥 면적 1,800 평방피트( 50)의 아마존 Go 매장에 100대 정도의 카메라를 설치해 고객의 움직임을 빠짐없이 모니터 하는 구조로 만든 것임


Ø 아마존 Go의 인식 정확도가 관심을 모았지만 오픈한 지 수 주일이 지났지만 특별히 큰 문제는 보고되지 않았으며, 판정 정확도는 실용화가 가능한 수준인 것으로 보임


Ø 한편 어떤 기자는 매장 측의 허락을 얻어 상품을 도둑질했지만 매장을 나올 때 앱으로 청구가 되었다는 보도가 있었으며, 아마존 Go가 매장의 도난 방지에도 도움도 줄 수 있다는 평가를 낳기도 하였음




ž 아마존은 아직 아마존 Go의 확장 계획에 대해 침묵을 지키고 있는데, 오픈한 매장의 구색을 보면 편의점 형태의 매장으로 보이며, 매장 개설 비용이 이슈가 될 것으로 예상됨


Ø 문을 연 아마존 Go 매장은 식료품이나 일용품을 중심으로 구색을 갖추고 있으며, 매장을 찾은 고객들이 소수의 상품만 구매하는 패턴이 눈에 두드러짐


Ø 아마존 Go가 사무실이 밀집한 거리의 편의점으로 운영될 것이라는 말도 나돌고 있는데, 시간에 쫓기는 직장인들이 점심시간에 아마존 Go에서 샌드위치와 음료를 손에 들고 뛰어 나오는 모습을 유스 케이스(Use Case)로 상정하고 있다고 함


Ø 실제 아마존 Go에는 계산원은 없지만 샐러드와 샌드위치 등 신선식품 조리와 자재 조달을 맡는 직원이 배치되어 있으며, 계산을 하기 위해 줄을 설 필요가 없기 때문에 직장인들의 점심 시간이 조금 더 늘려주는 효과를 제공하게 될 수도 있음


Ø 아마존은 추가로 아마존 Go 매장을 얼마나 늘릴 지에 대해 구체적 계획을 발표하지 않고 있는데, 이에 대해서는 수백 대의 카메라와 AI 시스템을 설치해야 하는 등 구축 비용이 만만치 않기 때문에 매장 늘리기가 쉽지 않을 것이라는 지적이 설득력을 얻고 있음


※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1801호(2017. 6. 21 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

신제품 홈팟(Homepod)에서 재확인된 애플의 프라이버시 우선 정책.pdf



[ 요 약 ]


애플 연례 개발자 컨퍼런스 WWDC 2017에서 예상대로 애플은 아마존 에코와 구글홈에 맞설 인공지능 스피커 홈팟(Homepod)을 발표하였음애플은 홈팟의 고음질 스피커로서 장점을 부각하고 있지만 홈팟의 부족한 인공지능 기능에 비판과 불만의 반응이 나오고 있음이러한 AI 성능의 차이는 사용자들의 데이터를 클라우드에서 처리하는 경쟁사들과 달리 기기 내에서만 처리하는 애플의 정책 때문으로, AI 기술의 활용에 있어 프라이버시 우선을 내세우는 애플의 철학을 보여주고 있음


[ 본 문 ]


ž 애플은 연례 개발자 컨퍼런스인 WWDC 2017에서 iOS 11 등 새로운 운영체제와 함께 신형 아이패드 프로(iPad Pro)와 스마트 스피커 홈팟(HomePod) 등 다수의 신제품을 발표


Ø 기조 연설에 나선 팀 쿡 CEO는 현재 앱스토어에 1,600만 명의 개발자가 등록되어 있으며, WWDC75개 국에서 5,300명의 개발자가 참여하는 세계 최대의 개발자 회의로 참가자의 연령 폭도 넓은데, 올해 대회의 최연소 참가자는 10, 최고령은 82세라고 소개하였음


<자료> Mac Rumors


[그림 1] WWDC 참가 최연소 및 최고령 개발자


Ø 기조 연설에 앞서 코믹한 동영상을 보여주었는데, 실수로 애플 데이터센터의 전원이 뽑히며 아이폰 앱을 사용할 수 없게 되자 전세계가 혼돈 위기에 빠진다는 내용으로, iOS 앱이 애플에게 정말 중요한가를 보여주며 앱 개발자에게 감사의 뜻을 전달하려는 의도였음 (동영상의 제목은 Applocalypse인데, 이는 성서에 나오는 세상의 종말을 의미하는 apocalypse와 app을 결합한 것)


[동영상] Appolcalypse(앱 세상의 종말) 


Ø 개별 신제품의 상세한 내용은 수석 부사장 크레이그 페데리히와 부사장 필 쉴러가 프레젠테이션 했는데, 올해 WWDC에서 선보일 것으로 기대를 모았던 스마트 스피커 제품으로는 홈팟(HomePod)을 발표하였음.


Ø 지금까지 12.9인치 버전과 9.7인치 버전의 2가지 모델로 라인업을 구성한 아이패드 프로(iPad Pro)와 관련해서는 완전히 새로운 모델인 10.5인치 버전을 발표하였음


Ø 애플 기기에 탑재되는 운영체제인 iOS, macOS, watchOS, tvOS 등에 대해서도 각각 업데이트 내용을 발표했는데, 특히 iOS 11에서는 증강현실(AR)을 지원한다는 점이 눈길을 끌었음


Ø 맥북과(MacBook)과 맥북 프로(MacBook Pro) 7세대 코어 프로세서를 탑재한 새로운 모델을 발표했으며, 아이맥(iMac) 역시 7세대 코어 프로세서를 탑재한 상위 모델로 아이맥 프로를 선공개하며 사전 주문을 시작하였음


ž 스마트 가전인 홈팟(HomePod)은 음성 인식 가상 비서인 시리(siri)를 통해 조작되는 7인치 높이의 스피커인데 애플은 제품 컨셉을 가정 내 음악 환경의 재발견이라고 소개




Ø 인공지능(AI) 스피커가 새로운 가전 시장으로 자리잡을 가능성이 확인됨에 따라, 이번 WWDC 2017에서 애플이 이미 시판 중인 아마존의 에코나 구글의 구글 홈, 그리고 마이크로소프트가 HP와 제휴를 통해 상용화 예정인 코타나 탑재 스피커 등과 경쟁할 제품을 선보일 것이라는 점은 공공연한 비밀이었음


Ø 예상대로 스피커 제품이 발표되기는 했으나 필 쉴러 부사장은 홈팟이 AI 가상 비서를 탑재하고 있다는 점보다는 중저음을 강화해 주는 우퍼소리가 나는 방향을 조정하는 빔포밍(beamforming)이 가능한 트위터(고음전용 스피커) 7고급 에코 제거 기능을 갖춘 마이크 6개를 탑재한 점 등 스피커로서 음질의 장점을 주로 어필하였음


Ø 홈팟 내부에는 아이폰 등에 사용해 온 애플의 CPU A8이 탑재되어 있어 높은 처리 성능을 갖추고 있는데, 이 역시 실시간 음향 모델링과 빔포밍 등 소프트웨어에 의한 음질의 향상을 위한 연산 처리를 위한 것으로 홈팟의 음질은 보스 등과 같은 프리미엄 급이라고 설명



<자료> Apple

[그림 2] 애플 홈팟 내부 부품 구성



Ø 홈팟은 애플의 구독형 음악 스트리밍 서비스 애플뮤직과 연동되며, 시리를 통한 음성 제어 역시 음악과 관련된 질문에 대한 대응을 특히 신경 써 개발했다고 함


Ø 물론 음악에 특화되어 있지만 경쟁 제품들과 마찬가지로 홈팟을 통해 뉴스와 날씨, 스포츠 경기 결과, 주변 교통 정체상황 등의 정보 읽기, 타이머 설정, 애플의 가전 제어 기술사양인 홈킷(Home Kit)을 지원하는 기기를 음성 명령으로 제어하는 것 등도 가능하다고 함


[1] 아마존, 애플, 구글의 인공지능 스피커 사용 비교

구분

아마존 에코

애플 홈팟

구글 구글홈

가상 비서

알렉사

시리

구글 어시스턴트

음악 지원

아마존 뮤직, 프라임 뮤직, 아마존 뮤직 언리미티드, 스포티파이 프리미엄,

판도라, 튠인, 아이하트레이디오, 오더블

애플 뮤직

구글플레이 뮤직, 스포티파이 프리미엄, 유튜브 뮤직, 판도라, 아이하트레이디오, 튠인

멀티 룸

현재는 미지원(예정)

에어플레이2

크롬캐스트 오디오

스마트홈 및

써드파티 지원

지원

홈킷만 지원

지원

마이크

원거리 음장 7

원거리 음장 6 +

저주파 보정 1

원거리 음장 2

스피커

2인치 트위터 +

2.5인치 우퍼

트위터 7 + 우퍼

2인치 드라이버 + 2인치 패시브 라디에이터 2

통신 연결

블루투스, 와이파이

와이파이

블루투스, 와이파이

크기, 무게

235 x 84 mm,

1,061 g

172 x 142 mm,

2,495 g

142.8 x 96.4 mm,

476g

가격

180 달러

349 달러

129 달러

<자료> Android Authority


ž 홈팟에 대한 현지 언론들의 평가는 음악 기능은 탁월할 지 모르나 중요한 인공지능 기능은 기대에 못 미친다는 견해가 지배적이나, 애플은 이런 지적에 크게 개의치 않는 모습


Ø 홈팟이 음악을 재생 할 때, 이봐 시리, 이 노래 좋은데라고 말하면, 홈팟은 여러 장르나 분위기의 재생 목록 중에서 사용자의 취향을 학습하게 되고, 이 학습 정보는 사용자의 여러 애플 기기에 걸쳐 공유됨


Ø 마찬가지로 홈팟에 이봐 시리 지금 이 곡의 드러머가 누구지?라고 물으면 홈팟은 해당 정보를 검색해 알려주거나, 드러머 정보를 바탕으로 다음 재생 목록을 만들어 공유할 수도 있음


Ø 홈팟은 공간 인식 기술을 이용하여 방의 구석, 책상 위, 책장 등 자신이 놓여있는 위치를 인식하여 더 나은 음질을 전달하는 기능도 갖추고 있음


Ø 그러나 홈팟의 음악 전달 기능이 뛰어나다고는 해도, 아마존 에코나 구글홈 같은 AI 기반 스마트 홈 허브를 기대했던 사람들은 홈팟에 대해 부정적 평가를 내놓고 있는데, 시리를 홈팟의 핵심 기능이 아니라 장식쯤으로 여겨야 한다는 신랄한 비판도 제기되고 있음


Ø 인공지능 스피커 시장의 후발주자이면서도 새로운 혁신이나 더 나은 기능 개선조차 보여주지 못하면서 오히려 가격은 349달러로 아마존 에코(179.99달러)나 구글홈(129 달러)에 비해 상대적으로 높게 책정한 점도 빈축을 사고 있음


Ø 스피커로만 보아도 부담스러운 가격에 연계 음악서비스도 제한적이기 때문에 애플 충성 고개들이라도 홈팟을 구매할 지는 미지수라는 예상이 많지만, 애플은 이런 평가에 아랑곳없이 뛰어난 음질로 몰입감 있는 개인화된 음악 경험을 제공할 수 있다는 점을 강조하고 있음


<자료> Android Authority


[그림 3] 아마존 에코 vs. 애플 홈팟 vs. 구글홈


ž 예상대로 애플이 시리 기반의 스피커 제품을 발표하긴 했으나, 재차 확인된 것은 스피커 기기를 대하는 애플의 자세가 아마존과 구글 등 경쟁자들과 크게 다르다는 점


Ø 애플이 시리 관련 기능보다 음질에 대한 설명에 많은 비중을 둔 것은 경쟁사들과 겨냥하는 시장이 다르기 때문이란 분석인데, 경쟁사인 아마존 역시 홈팟에 대해 에코와는 철학이 다르기 때문에 소비자들의 머리 속에서 두 제품이 다툴 것으로 보이지 않는다는 평을 내놓고 있음


Ø 에코와 구글홈의 활용 공간이 거실, 주방, 침실 등으로 넓은 데 비해, 애플은 홈팟의 이용 공간을 거실로 한정하고 고급 오디오 기기로서 차분히 음악을 즐긴다는 목적에 충실히 따르게 하려는 모습을 보이고 있다는 것



Ø 홈팟에 탑재되는 Anonymous ID(익명)라는 기능도 주요 차이점 중 하나인데, 홈팟은 애플 아이디(Apple ID)로 로그인하지 않아도 홈팟을 사용할 수 있는 구조로 되어 있음


Ø 반면 아마존 에코나 구글홈은 각각 아마존과 구글 계정으로 로그인 한 상태가 아니면 사용할 수 없으며, 구글홈의 AI 가상 비서인 구글 어시스턴트의 경우 사용자의 음색 차이까지 식별해 맞춤형 응답을 할 수 있다는 점을 차별화 포인트로 내세우기까지 하고 있음


ž 스피커를 바라보는 입장 차이는 근본적으로 인공지능(AI) 활용 방식의 차이에서 기인하는데, 애플은 단말기 상에서만 사용자의 데이터를 처리한다는 원칙을 고수하고 있음


Ø 시리가 아마존 알렉사나 구글 어시스턴트보다 사용자 응답의 정확성이 떨어진다는 평가에 대해 애플 스스로도 어느 정도 인정하고 있는데, 애플이 양질의 데이터를 가지고 있다고는 하지만 구글과 아마존이 보유한 데이터 양에는 비견할 바가 못되기 때문


Ø AI의 성능은 AI를 학습시키는 데이터의 양과 질에 의해서 크게 좌우되기 마련인데, 애플은 사용자 프라이버시 우선 원칙을 고수하고 있고 이로 인해 시리는 6개월 동안만 데이터를 저장함


Ø 아마존이나 구글의 경우 사용자의 데이터를 지속해서 저장하고, 이를 바탕으로 AI 서비스를 제공하기 때문에 빅데이터라는 측면에서 장기적으로 애플에 우위를 가질 수밖에 없음


Ø 사진 분석 서비스를 비교해 보면, 구글 포토 서비스는 일단 클라우드에 수 많은 이용자들의 사진을 백업한 후 얼굴 인식이나 피사체의 분류 등을 수행하는 반면 애플은 아이폰과 아이패드 상에서 사진을 분석하고 얼굴 인증이나 피사체 분류 장면 분석 등을 수행하고 있음


Ø 이 때문에 인터넷에 연결되지 않은 와이파이 전용 아이패드에서 사진을 찍어도 제대로 분류가 이루어지는 것인데, 대신 이 경우 모바일 장치의 분실이나 손상으로부터 데이터를 지킬 수 없는 단점이 있기 때문에 애플의 경우 아이클라우드에 별도 백업을 권장하고 있음


ž 애플의 AI 전략을 상징하며, iOS 11 등에도 탑재한다고 발표한 코어ML(Core ML) 역시 클라우드가 아닌 모바일 기기 상에서의 딥러닝(Deep Learning) 실행에 초점을 맞추고 있음


Ø 코어ML은 아이폰과 아이패드 등의 앱에서 기계학습과 딥러닝(심층학습) 기반의 AI 기능을 탑재하기 위한 소프트웨어 프레임워크임


Ø 앱 개발자는 코어ML을 통해 제공되는 얼굴 인식이나 문자 인식 등의 API(응용 프로그래밍 인터페이스)를 호출하는 코드를 작성하기만 하면 이러한 AI 기능을 자신의 앱에 구현할 수 있게 되며, 게다가 이러한 AI 기능을 클라우드가 아닌 모바일 장치 상에서 처리되도록 할 수 있음


Ø 코어ML은 기존의 딥러닝 소프트웨어 라이브러리인 카페(Caffe)케라스(Keras)를 사용하여 개발된 딥러닝 모델을 모바일 기기에서 이용할 수 있게 해주는 기능도 갖추고 있어, 앱 개발자들이 보다 쉽게 딥러닝을 모바일 기기에서 실행할 수 있게 하는데 초점을 맞추고 있음


Ø 딥러닝을 통한 학습이나 추론을 하는 경우, 클라우드에서 실행하는 기존 방식으로는 네트워크가 단절되면 AI 기능을 활용할 수 없게 되는 단점이 있었는데, 모바일 기기 자체에서 AI 기능을 사용할 수 있게 함으로써 개발 편의성뿐 아니라 사용자 프라이버시 보호도 개선한 것임


ž 데이터 획득과 활용에 대한 애플의 접근방식이 서비스 측면에서 더 나은 차별성을 제공할 것 같지는 않지만, 최소한 프라이버시 이슈에 대한 확실한 관리 방안은 될 것으로 보임


Ø 애플과 구글의 사진 서비스는 현재 겉보기로는 별 차이가 없어 보이지만, 자신의 사진이 다른 사람의 사진과 함께 분석되는 것과 개인의 사진이 프라이버시를 유지한 형태로 분석되는 것의 차이는 시간이 지날수록 더 선명하게 드러날 가능성이 있음


Ø 특히 사진 이외 데이터의 처리를 생각해 보면 애플과 경쟁사의 접근방식을 바라보는 시각이 크게 달라질 수 있는데, 가령 프라이버시 관점에서 사진보다 더욱 민감할 수 있는 개인의 건강이나 의료 관련 데이터가 그러함


Ø 아이폰은 사용자의 단말기 사용 상황이나 메시지를 분석하고 그 장면에 가장 적합한 앱이나 응답 문구를 제시하는 구조를 갖추고 있으며, 개인의 건강 및 의료 정보 데이터 역시 아이폰 또는 애플워치 내에 축적하려 하고 있음


Ø 이번에 발표된 애플워치의 새 운영체제 watchOS 4의 경우, 시리를 이용한 지능형 시계 인터페이스 기능을 새로 탑재했고, 기계학습 기반 알고리즘으로 미팅 일정 등을 적절히 업데이트하며, 운동 기능은 여러 장비와 연결하여 정확한 데이터를 기반으로 사용자를 지원하는데, 애플워치의 데이터 역시 기기 자체와 아이폰이라는 범위를 넘어 저장되지 않음


Ø 이에 비해 구글의 경우 의료 데이터를 사진 데이터와 같은 방식으로 처리한다면 모든 이용자의 데이터를 일단 클라우드로 모은 후 분석을 해야 하는데, 사람들이 의료 데이터도 사진 데이터와 마찬가지로 구글 클라우드로 큰 거부감 없이 자동 백업할 지는 미지수임


Ø 사진에도 많은 개인 정보가 포함되지만, 건강 및 의료 데이터를 위시해 생활에 밀접한 정보의 분석을 할 경우 프라이버시 보호가 더욱 중요해지는데, 애플이 단말기로 제한된 분석 방식을 고수하는 것은 향후 개인들의 개인정보보호 의식의 높아지는데 대한 위험 회피 수단이 될 수 있을 것임


<자료> Apple

[그림 4] 애플의 프라이버시 우선 정책


ž 애플의 프라이버시 우선 정책은 향후에도 변함이 없을 것으로 전망되며, 기술의 개발 방향도 단말기 상에서 빠르고 신속한 데이터 처리에 초점이 맞춰질 것으로 보임


Ø 애플은 맥용 프로세서는 인텔의 공급에 의존하고 있지만, 아이폰용 프로세서는 자체 설계 한 전용 모델을 이용하고 있는데, 이는 저전력과 고성능을 실현하고 앱의 시작과 전환 등 스마트폰의 사용 성능에서 안드로이드폰에 대한 우위성을 확보하기 위해서임


Ø 애플은 아이폰의 핵심 프로세서를 아이패드나 애플TV에도 활용하고 있으며, 또한 애플워치용으로는 S1, S2라는 스마트 워치 전용 프로세서를, 에어팟용으로는 W1이라는 프로세서를 개발, 구현하였음


Ø 이처럼 애플은 자사 디바이스에 필요한 전용 칩을 독자적으로 제공하는 체제를 정비해왔기 때문에, 단말기에서 기계학습 등의 AI 처리에 있어서도 자연스럽게 자신들이 직접 칩을 설계하고 구현하려는 모습을 보이고 있음


Ø WWDC 2017을 앞두고 애플은 최신 AI 전용 프로세서인 애플 뉴럴 엔진(Apple Neural Engine)이 신형 아이폰과 아이패드에 탑재한다고 밝혔는데, 이점 역시 구글이 새로 선보인 TPU가 수퍼컴퓨터와 서버 환경에 도입되는 대규모 처리를 위한 프로세서인 것과 대비되는 지점임


Ø 연산처리는 작은 모바일 기기 상에서 하는 것보다 클라우드에 있는 수 많은 컴퓨터에 의해 병렬처리 되는 쪽이 자연스러운 추세이지만, 애플은 사용자 데이터를 가능한 한 아이폰 밖으로 내보내지 않고 처리하는 것이 목표이므로 AI 칩 역시 기기에 내장하는 것임


ž 애플의 프라이버시 우선 정책이 자충수일지 선견지명이 될 지는 향후 이용자가 제공하는 빅데이터의 획득 및 활용에 관한 사회적 협의가 어떻게 이루어지느냐에 따라 판명될 전망


Ø 아마존과 구글이 택하고 있는 클라우드 기반 인공지능 처리 방식에 대해서는 데이터 보안을 우려하는 목소리도 서서히 나오고 있는데, 이용자들이 에코나 구글홈이 집 안에서 이루어지는 대화들을 전부 다 듣고 있다는 사실을 인식하기 시작했기 때문


Ø 게다가 에코에 카메라가 장착되기 시작하면서부터는 대화뿐 아니라 가정 내의 영상이 클라우드에 전송되는 것이기 때문에, 만일 보안이 뚫리게 된다면 다양하게 악용되어 잠재적 피해의 범위가 매우 커질 수 있다는 우려의 목소리가 더욱 힘을 얻고 있음


Ø 보안의 문제가 아니더라도, 개인의 데이터를 클라우드로 모은 후 서비스 기업이 이를 통해 수익을 창출한다면 그 수익을 사용자들에게 배분하거나 혹은 데이터를 획득하는 시점에서 보상이 주어져야 한다는 의견도 있음


Ø 사진 같은 경우 클라우드에 백업 공간을 무료로 제공한다는 반대급부가 있기는 하나, 그 비용과 서비스 수익의 크기가 대칭적인지에 대해서는 이용자들이 판단할 근거가 없음


Ø 이런 면에서 볼 때, 프라이버시 보호 문제가 지금보다 더욱 강하게 대두된다면, 궁극적으로 애플의 접근방식이 사람들로부터 선택될 가능성도 있는 것이며, 실제로 애플은 이런 시나리오로 전개될 것이라는 판단을 하고 있는 것처럼 보임


Ø 구글 역시 안드로이드 차기 버전인 Android O에서는 모바일 기기에 딥러닝 프레임워크인 텐서플로우 라이트(TensorFlow Lite)를 탑재할 예정인데, 이는 애플과 동일한 방식으로 프라이버시 이슈를 어느 정도 염두에 둔 행보로 볼 수 있음


Ø 아마존, 구글, MS 등 경쟁사들이 클라우드 기반 인공지능을 통해 애플의 접근 방식보다 압도적인 편의성과 혁신을 창출할 수 있을지, 아니면 그렇지 않은 상황에서 프라이버시 이슈가 대두되며 애플에 상황이 유리해질 것인지 향후 관심 있게 지켜볼 대목임

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1799호(2017. 6. 7 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

딥러닝 용도로 기대 모으는 인텔 퍼시스턴트 메모리(PM).pdf



ž 인텔은 SSD 보다 빠르고, DRAM 보다는 가격 경쟁력이 있는 비휘발성 신형 메모리로 인텔 퍼시스턴트 메모리(Intel persistent memory)를 발표하고 데모를 선보였음


Ø 인텔 퍼시스턴트 메모리는 인텔과 마이크론 테크놀로지가 2015년에 발표한 3D XPoint 기술을 바탕으로 한 제품으로 DIMM(여러 개의 DRAM 칩을 회로 기판 위에 탑재한 메모리 모듈) 슬롯에 삽입되어 메인 메모리로 동작함


Ø 메인 메모리의 역사를 보면 1947 RAM의 등장 이후 주기적으로 발전을 거듭해오다 1989 NAND 플래시 메모리 등장 이후에는 신형 메모리가 나오지 않았는데, 이 때문에 3D XPoint는 발표 당시 수십 년 만에 개발된 메인 메모리로 큰 관심을 모은 바 있음


Ø 퍼시스턴트 메모리(PM)DRAM과는 달리 기계의 전원이 꺼져도 데이터가 지워지지 않는 비휘발성 메모리의 일종으로 SSD 보다 빠르고 DRAM보다 대용량화하기 쉬운 특성을 갖추고 있는데, 인텔은 2018년을 발매 시점으로 잡고 있음


<자료> toms Hardware


[그림 1] 메인 메모리 도입의 타임라인


Ø 인텔이 자세한 사양을 밝히고 있지 않지만 만일 3D XPoint 발표 때와 동등한 수준이라면 액세스 속도는 SSD에 비해 1,000배 빠른 것이며, 이는 DRAM과 비교하면 느린 것이지만 기록 밀도는 DRAM 10배이기 때문에 DRAM보다 대용량 메모리를 탑재한 시스템을 구현하기가 쉬워짐


Ø 인텔은 SAP가 개최한 Sapphire Now 2017 행사에 참가해 대용량 메모리 공간을 만들 수 있음을 강조했는데, 메인 메모리로 192 기가바이트 DRAM 1.5 테라바이트 인텔 퍼시스턴트 메모리를 장착한 서버에서 SAP의 인메모리 데이터베이스인 SAP HANA의 실행 데모를 선보였음


Ø 데모를 통해 처리할 데이터의 특성에 따라 DRAM과 퍼시스턴트 메모리를 구분하면 충분히 빠른 속도로 처리할 수 있으며, DRAM만으로 구성하는 것보다 낮은 비용으로 대용량의 메모리를 탑재한 시스템을 구축할 수 있음을 보여 주었음


ž 전문가들은 대규모 데이터를 학습하는 과정에서 대용량 메모리 공간을 필요로 하는 딥러닝이 인텔 신형 메모리의 유력한 사용처가 될 것으로 전망하고 있음


Ø 인공지능(AI) 관련 기술 중 하나인 딥러닝(Deep Learning, 심층 학습)은 대규모의 입력 데이터를 빠르게 학습해야 할 필요가 있는데, DRAM으로 대용량 메모리 시스템을 구현하면 비용이 높아지고, SSD 등 플래시 메모리로 구성하면 데이터 액세스 성능이 너무 느려지는 문제가 있었음


Ø 그런데 인텔 퍼시스턴트 메모리를 이용한다면 DRAM SSD 사이의 간극을 메우는 비용효율적 시스템의 구성이 가능해지기 때문에 딥러닝 용도에 적합하다는 평가가 나오고 있는 것


Ø 같은 맥락에서 이 신형 메모리가 딥러닝 뿐만 아니라 기업 정보시스템의 데이터베이스에도 큰 영향을 미칠 것이라는 예상도 나오고 있는데, 현재 트랜잭션 처리용과 데이터 분석용 데이터베이스를 나누고 있는 기업정보시스템의 상식을 무너뜨릴 가능성이 거론되고 있음


Ø 트랜잭션 처리와 데이터의 분석 요구 사항을 모두 만족시키려면 다수의 코어를 가진 프로세서와 대용량 메모리를 탑재한 서버가 필요한데, 이러한 대용량의 메모리 공간을 실현하는데 있어 DRAM보다 대용량화하기 쉬운 인텔 퍼시스턴트 메모리가 도움을 줄 수 있기 때문


ž 또한 퍼시스턴트 메모리의 비휘발성 특성을 잘 살리면 IoT 시대의 적합한 새로운 형태의 컴퓨터가 등장할 가능성도 제기되고 있음


Ø 일례로 평상시에는 전원을 꺼두었다가 필요할 때 전원을 넣으면 곧 바로 사용할 수 있는 노멀리 오프 컴퓨팅(Normally-Off Computing)이 가능하게 됨


Ø 전원을 끄고도 메인 메모리에 장착된 인텔 퍼시스턴트 메모리에 데이터가 유지된다면, 전원을 켜고 처리가 가능하게 될 때까지의 부팅 시간이 현재의 컴퓨터 시스템에 비해 훨씬 짧아질 것이므로 사용하지 않는 시간에 꺼두어도 필요할 때 신속히 사용하는데 별 문제가 없기 때문


Ø 특히 부팅 시간이 오래 걸리는 IoT(사물인터넷) 컴퓨팅 분야에서 노멀리 오프 컴퓨터에 대한 기대가 높아질 것으로 예상되고 있음


Ø 이러한 비휘발성의 특성을 살리려면 몇 가지 넘어야 할 장벽이 있는데, 우선 OS(운영체제)나 미들웨어 등이 비휘발성 메모리를 상정한 처리가 가능해져야 함


Ø 또한 시스템을 설계하는 IT 엔지니어들도 시스템의 내부 구조를 이해하고 어떤 데이터를 어떤 메모리에서 처리할 것인지 등을 제대로 인식하고 설계할 필요가 있음


Ø 해결해야 할 과제가 있지만, 그래도 인텔 퍼시스턴트 메모리는 인공지능 기술의 발전 속도를 높일 수 있고, 컴퓨터의 아키텍처를 크게 바꿀 잠재력을 가지고 있다는 점에서 올 한해 많은 관심을 받게 될 것으로 예상됨

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1787호(2017. 3. 15 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

실시간주차정보 센서 vs 기계학습 방식.pdf



[요 약]


스마트 시티 구축에서 중요 요소 중 하나는 주차 공간 정보를 실시간으로 정확하게 제공하는 것인데주차장 정보 시스템을 구축하기 위한 방법으로 현재 미국에서는 두 가지 기술방식이 경쟁하고 있음공공기관은 센서(IoT) 기술을 이용한 정보 집약 방식을 택하고 있으며민간기업 구글은 기계학습 기술을 이용한 알고리즘 방식의 정보 집약 방식을 택하고 있음스마트한 도시 정보 제공을 위한 센서와 알고리즘의 경쟁에서 누가 이길 것인지를 놓고 미국 내 관심이 높아지고 있음


[본 문]


ž 주차장 관리는 전통적으로 사물인터넷(IoT)의 전문 분야 중 하나로, 설치된 센서를 통해 차량의 주차 유무를 파악해 전반적인 혼잡 상황을 파악함


Ø 주차 관리 및 혼잡 정보를 발신하는 것은 행정부문의 책임이기도 한데, 따라서 최근 스마트 시티 구축에 나서려는 국가와 도시들은 대체로 센서 기술을 이용해 주차와 차량 관련 정보를 집약, 분석, 제공하려는 시도를 하고 있음


Ø 미국 캘리포니아주 샌프란시스코시의 경우도 주차장에 IoT를 적용하여 혼잡도를 파악하는 SF Park(SF 파크)라는 실증 실험을 진행하고 있음


Ø 샌프란시스코 시가지에 있는 노상 주차장에는 주차 미터기(Parking Meter)가 설치되어 있는데, 이용자들은 주차 후 동전이나 카드, 앱으로 요금을 지불하게 되어 있음


Ø 주차와 동시에 주자 미터기의 센서가 작동하여 차의 유무를 감지하며, 주자 미터기에 연결된 IoT 전용 네트워크인 시그폭스(Sigfox)를 통해 주차 공간의 혼잡 정보가 집약됨


ž 샌프란시스코시는 계획대로 IoT 주차 관리 시스템이 완성되면 주차 혼잡 정보를 실시간으로 알 수 있게 될 것으로 기대하고 있으나, 이 작업은 쉽지 않은 일이라는 지적도 있음


Ø 전문가들은 주차 미터기가 주차 여부를 제대로 감지 할 수 있는가 하는 문제가 있기 때문에, 계획대로 주차 혼잡도 정보가 제대로 파악될 수 있을지를 관심 있게 지켜보고 있음



[동영상] 샌프란시스코시의 SF Park 프로젝트에 사용되는 주차 미터기(Parking Meter)


Ø 가령 주자 미터기가 있는 주차 장소에 누군가 불법 주차하거나 또한 특별 허가증을 가진 차량이 주차하는 경우에는 공간 여유가 있다고 판단될 가능성이 있음


Ø 반면 주차 시간이 아직 남아 있는 상태에서 자동차를 빼는 사람도 있을 텐데, 이 경우에도 주차 중이라고 판단될 가능성이 있음


Ø 이런 이유 때문에 실시간으로 정확한 주차 공간 정보를 파악하는 것은 어려운 작업이며, 현재 실험 중인 주차 미터기 시스템에 보완이 필요하다는 의견이 적지 않음


ž 이에 비해 구글은 접근 방식을 바꿔 센서를 사용하지 않고 알고리즘의 파워를 통해 혼잡 상황을 파악하고 시설을 관리한다는 아이디어를 구현하고 있음


Ø 구글은 소프트웨어를 통해 차량의 흐름을 기계학습(Machine Learning)으로 분석해 혼잡 상황을 정확히 추정하려고 하는데, 이러한 아이디어는 지난 달부터 시작된 구글 지도의 주차장 혼잡 상태 표시 서비스에 반영되어 있음


<자료>Google


[그림 1] 구글 지도의 주차장 혼잡 정보 제공


Ø 현재 구글 지도에서 목적지까지의 경로를 검색하면 [그림 2]에서 보는 것처럼 화면 하단에 주차를 의미하는 아이콘과 함께 목적지 주변의 주차 난이도가 표시됨


Ø 주차장 혼잡도는 수월(easy), 보통(Medium), 한정(limited)의 셋 중 하나로 표시되며, 수월이나 보통의 경우 가 파란색으로 표시되는데, 이는 주차 공간을 찾기가 어렵지 않아 제 시간에 출발해도 괜찮음을 의미함


Ø 반면, 주차장 상태가 한정(Limited)일 경우 는 붉은색으로 표시되는데, 이는 말 그대로 주차 공간이 한정되어 있어 주차 장소를 찾는데 시간이 걸릴 수 있다는 뜻이므로, 이용자는 주차에 걸리는 시간을 감안해 출발 시간을 조정하는 등의 판단을 할 수 있음


Ø 구글 지도는 주차가 어려울 경우 전철로 이동하는 것이 좋겠다는 등의 대안을 제시하고 있는데, 구글에 따르면 이 주차 정보 서비스를 시작한 이후 실제로 전철로 이동하는 루트의 검색 건수가 급증했다고 함


ž 구글에 따르면 이 서비스를 위해 주차 공간을 파악하는데 크라우드 소싱(crowd sourcing)기계학습이라는 두 기법을 사용 중이라고 함


Ø 구글은 이 새로운 서비스의 구조를 기계학습을 이용한 주차의 어려움 예측(Using Machine Learning to predict parking difficulty)이라고 이름 붙여 발표하였음


Ø 크라우드 소싱과 기계학습이라는 두 가지 적용 기술 중 크라우드 소싱은 사용자의 다양한 데이터를 집약하여 이용하는데 사용되고 있으며, 기계학습은 여러 가지 요인을 고려하여 주차 패턴을 분석하는데 사용된다고 함


ž 크라우드 소싱으로 집약되는 데이터에는 사용자의 위치 정보, 체류 정보, 주차장 찾기까지 걸린 시간 정보 등이 포함됨


Ø 주차 혼잡도 정보 제공 서비스를 위해 구글은 구글 지도에서 모은 사용자 위치 정보를 이용하고 있는데, 구글은 일찍부터 사용자 동의 하에 입수한 사용자의 위치 데이터를 이용해 다양한 서비스를 전개하고 있음



<자료> Google Help


[그림 2] 구글 지도의 혼잡시간과 방문지속시간


Ø 사용자 위치 정보를 이용한 대표적인 서비스는 구글 지도에 나타나는 실시간 트래픽(Live Traffic) 현황으로 차량의 흐름 상태를 실시간으로 표시해 줌


Ø 또한 구글 지도는 상점과 레스토랑의 혼잡 시간(Popular Time) 방문 지속시간(Visit Duration) 정보도 제공하고 있는데, 이들은 모두 유용한 정보 도구로서 이미 생활의 일부로 이용되고 있음


Ø 이들 데이터 외에도 구글 지도에서는 사용자에게 주차장을 찾기까지 시간이 얼마나 걸렸습니까?라는 질문을 보내고 답변을 집약한 후 주차장 찾기의 난이도를 산출한다고 함


Ø 구글은 이를 위한 기법 중 신뢰도가 높은 지상 실측자료(Ground Truth) 방법을 사용해 데이터를 수집한다고 하는데, 지상 실측자료는 원격탐사자료를 분석하고 해석하는데 뒷받침이 될 수 있는 자료로 지상에서 직접 측정하고 확인한 보조자료 및 기준 자료를 의미함


ž 그러나 이 크라우드 소싱 방법만으로는 주차장의 정체를 정확히 추정할 수 없는데, 차를 주차하는 패턴의 수가 많고 이러한 요인을 고려할 필요가 있기 때문


Ø 예를 들어, 자동차를 사유지에 주차하는 이용자가 많다면 주차 소요 시간은 짧을 것인데 알고리즘은 이를 주차 여유 공간이 있는 것으로 오인할 가능성이 있음


Ø 또한 이용자가 택시나 버스로 이동한 경우도 주차 소요 시간이 걸리지 않으므로 알고리즘은 주차 공간이 있는 것으로 오인할 가능성이 있으며, 이처럼 주차 공간을 판정하는 데 크라우드 소싱 방식으로는 한계가 있는 것임


<자료> Google


[그림 3] 차량 이동 패턴으로 주차공간 예측


Ø 이 때문에 자동차가 어떤 패턴으로 이동하면 주차장이 없음을 의미하는지, 그 특징량을 찾아내는 것이 관건이 되는데, 가령 [그림 3]처럼 점심 시간에 자동차가 거리를 뱅뱅 도는 움직임을 보이면 주차장이 없기 때문으로 판단하는 모델을 설정할 수 있음


Ø 반면, 이용자가 목적지에 도착하여 그대로 시설에 들어갔을 경우에는 주차장이 있었다고 판단할 수 있는데, 구글은 이러한 특징량을 파악하여 알고리즘에 반영하였음


Ø 이 밖에도 목적지의 특수한 조건이나 주차장의 위치에 따라 달라지는 요인도 고려할 필요가 있었다고 하며, 주차 시간과 주차 날짜에 따라 달라지는 조건 등을 도입하였음


Ø 또한 과거의 통계 정보도 이용하였는데, 이런 방식으로 구글은 최종적으로 20개의 모델을 분석하였고 이를 이용하여 알고리즘을 교육했다고 함


ž 앞서 언급한 기계학습 기술이 바로 이 20개 모델의 분석에 사용되었는데, 기계학습의 다양한 방법 중에서도 로지스틱 회귀분석(Logistic Regression)이 사용되었음


Ø 로지스틱 회귀분석은 변수간 인과관계를 분석하기 위한 통계학의 대표적인 기법으로서, 영향을 주는 변수가 연속형(3개 이상의 값)이고 영향을 받는 변수가 범주형(0 1의 두 값)일 때 변수 사이의 인과관계를 추정하는 것임


Ø 로지스틱 회귀분석으로 알고리즘을 교육하여 변수를 입력하면 어떤 사항에 대해 그 결과를 예상할 수 있는데, 이 경우에는 운전자의 운행 데이터를 입력하면 주차장을 찾기가 쉬울지 어려울 지를 예측할 수 있음



<자료> Google

[그림 5] 기계학습을 통한 주차장 혼잡 예측


Ø 알고리즘은 주차가 쉽다어렵다의 두 값을 출력하게 되며, 따라서 이는 바이너리 로지스틱 모델(Binary Logistic Model)이라 부를 수 있음


Ø 이 기법으로 샌프란시스코 도심 주차장의 혼잡을 예측하면 [그림 4]와 같이 시가지를 구획으로 나누어 각 주차장의 정체를 표시하게 되는데, 짙을 수록 혼잡이 심함을 나타냄


Ø 상단은 월요일, 하단은 토요일을 나타내며, 왼쪽은 오전 8시 오른쪽은 오후 9시의 표준적인 혼잡 정보를 표시하는데, 월요일 아침은 상업 지역의 주차장이, 토요일 밤은 관광 명소 지역의 주차장이 붐비는 것을 알 수 있음


ž 전문가들은 구글이 딥러닝(Deep Learning) 기술 부문에서 세계를 선도하고 있음에도 불구하고, 과감히 기계학습 기술을 주차 예측에 적용한 것에 관심을 표시하고 있음


Ø 인간의 뇌를 본 뜬 인공지능인 신경망(Neural Network)을 활용하는 대신 통계적 기법인 로지스틱 회귀분석을 사용한 것에 대해, 구글은 로지스틱 회귀분석이 이미 확립된 기술이어서 그 작동방식을 이해하기 쉽기 때문이라 설명함


Ø 이런 설명은 신경망은 그 내용이 블랙 박스이기 때문에 작동방식을 이해하기 어렵다는 인공지능 연구의 최신 이슈를 잘 보여주는 것이기도 함(주간기술동향 1778호 최신ICT이슈 답은 맞는데 풀이과정을 알 수 없는 인공지능을 믿어야 할까? 참조)



[그림 5블랙박스처럼 알 수 없는 신경망


Ø 비단 구글만이 아니라 최근 다른 인공지능 연구 기업들에서도 기계학습을 재검토하려는 움직임이 확산되고 있는데, 신경망 전성 시대가 도래하고 있긴 하지만 오랜 세월에 걸쳐 축적된 기술을 개량하고 잘 이용하려는 시도도 병행하려는 것임을 알 수 있음


Ø 물론 기계학습에 재주목하는 것과 동시에 신경망이라는 블랙박스를 열어 구조를 해명하려는 연구도 더욱 본격적으로 전개될 것임


Ø 구글의 주차장 혼잡 예측 모델을 통해 유추해 본다면 AI 연구의 관점에서 올해의 큰 테마는 기계학습의 개량과 신경망의 해명이라 할 수 있음


ž 아무튼 주차장 혼잡 정보 예상 서비스를 놓고 미국에서는 센서와 알고리즘의 싸움이 시작되었으며, 둘 중 누구의 손이 올라 갈지를 두고 많은 이들이 흥미롭게 지켜보고 있음


Ø 구글과 SF 파크의 노력은 현재 미국 전역에서 전개되고 있는 스마트 시티 개발의 모델 케이스로 주목받고 있으며, 따라서 둘 중 어느 쪽이 경쟁에서 이길 것인지에 대해 지역 주민들뿐만 아니라 전국적인 관심이 높아지고 있는 상황


Ø 물론 수십 조 개의 센서를 활용해 데이터를 수집, 분석하려는 시도에 비해 알고리즘은 보다 비용효과적일 수 있다는 점에서 양자가 대립 구도로 규정되고 있기는 하나, 기술의 정확도 면에서 센서와 알고리즘은 물론 상호 보완적으로 접목될 가능성도 높을 것임




※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1778호(2016. 12. 28 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

풀이과정을 알 수 없는 인공지능에 대한 신뢰성.pdf



[ 요 약 ]


딥러닝(Deep Learning)을 응용한 시스템의 활용이 사회 각 분야로 확산되고 있으나, 동시에 AI의 문제점도 명확히 드러나고 있음. 문제 제기의 핵심은 AI를 믿을 수 있는가 하는 것인데, 이는 AI의 결정 메커니즘을 사람이 온전히 알 지 못한다는 점에서 기인함. 의사보다 암 진단 정확도가 높지만, AI가 왜 그렇게 판단했는지를 모르기 때문에 신뢰성의 문제가 제기되는 것이며, 따라서 2017년에는 AI의 작동 메커니즘을 규명하려는 움직임이 적극 전개될 것으로 예상



[ 본 문 ]


◈ 인공지능(AI) 활용 시도가 다양하게 전개되면서, 사람들은 점차 인공지능(AI)을 과연 신뢰해야 하는가라는 문제에 직면하고 있음


딥러닝(Deep Learning) 기법을 응용한 다양한 인공지능 시스템 활용 사례가 속속 소개되며 기대감이 커지고 있으나, 동시에 AI의 문제점도 명확해지고 있음


AI는 통계학적 수법을 통해 입력된 데이터로부터 어떤 특징의 양을 정밀하게 감지하며 의사결정을 내리는데, 사람들을 곤혹스럽게 하는 점은 AI가 왜 그런 의사결정을 내렸는지에 대해 설명해 주지 않기 때문임


가령 자율운전 차량은 인간보다 훨씬 안전하게 주행할 수 있다는 것이 실험을 통해 입증되고 있지만 그 운전 기술의 요체는 AI 개발자들도 모르며 오직 AI만 알고 있기에, 사람들은 안전할 거 같긴 한데 믿을 수 있을까라는 애매한 감정을 갖게 됨


구글 딥마인드는 바둑 인공지능 알파고를 개발하며 바둑의 규칙조차 입력하지 않았지만, 대결에서 패한 인간 최고수로부터 바둑을 이해하는 새로운 관점을 얻게 되었다는 찬사를 이끌어 냈는데, 이런 사실에 사람들은 기대감과 불안감을 동시에 느끼는 것


사정이 이렇다 보니 사람들이 느끼는 불안감 속에는, 사람이 AI를 이해하지 못하는 것이 아닌지, AI가 사람을 능가하는 것은 아닌가 하는 존재론적 의심도 배어 있음


AI에 내포된 이런 본질적 문제는 다양한 형태로 드러나고 있는데, 중국계 AI 연구자들이 최근 발표한 얼굴 특징으로 범죄자를 식별하는 기술은 큰 논란을 낳고 있음


상하이교통대학(Shanghai Jiao Tong University)은 지난 11 13얼굴 이미지를 이용한 범죄연관성에 관한 자동화된 추론(Automated Inference on Criminality using Face Images)이라는 논문을 공개


공개된 지 얼마 안되어 아직 피어 리뷰(동료 전문가 평가, peer review)도 끝나지 않았지만, 논문에 따르면 알고리즘은 89%의 정확도로 범죄자를 식별한다고 하는데, 즉 얼굴 사진을 알고리즘에 입력하면 그 사람이 범죄자인지 여부를 거의 알 수 있다는 것


이 연구에는 딥러닝 등 얼굴인식 AI 기술이 사용되었으며, 알고리즘을 훈련시키기 위해 남성 1,856명의 얼굴사진을 사용했고 그 중 730명이 범죄자였다고 함




<자료> Xiaolin Wu & Xi Zhang


[그림 1] 얼굴인식 AI 기법을 이용한 범죄자 식별 가능성 연구


• 논문은 범죄자의 얼굴에 세 가지 특성이 있다고 언급하고 있는데, 윗입술의 선이 보통 사람에 비해 급격히 내려가고(그림1 오른쪽 이미지 속의 p), 두 눈의 간격이 좁으며(d), 코와 양 입가 사이에서 만들어지는 각도가 좁다(θ)는 점을 들고 있음


이 논문은 현재 논란의 와중에 있는데, 인물의 행동에서 범죄자를 식별하는 방법은 이미 감시 카메라 등으로 사용되고 있지만, 얼굴의 특징으로 범죄자를 가려낸다는 AI를 믿을 수 있는가 하는 의문이 제기되고 있는 것


AI는 학습 데이터를 바탕으로 통계 처리를 하는 것이지, 얼굴의 모양과 범죄자를 연결시키는 논리가 아닌데, 만일 AI가 범죄 수사에 사용된다면 일반 시민들이 이유를 알지 못한 채 용의 선상에 오르게 될 지도 모른다는 우려가 나오고 있음


◈ 딥러닝이 사회문제가 될 수 있는 불씨는 도처에 도사리고 있는데, 세계 최첨단 AI 기술력을 보유한 구글 역시 AI와 관련해 인종차별 이슈로 문제점을 지적받고 있음


구글의 유튜브는 청각 장애인을 위해 동영상 속의 음성을 자막으로 표시하는 기능이 있는데, 구글은 이 기능에 AI를 사용하고 있음


미국국립과학재단(National Science Foundation)의 레이첼 태트먼(Rachael Tatman) 연구원은 유튜브의 캡션 기능에서 동영상 속 화자가 남성일 경우와 여성일 경우 캡션의 정확도가 다르지 않은가에 대해 조사를 실시하였음


<자료> Rachael Tatman.


[그림 2] 구글 음성인식의 성별 편견


• 그 결과 유튜브는 남성의 목소리를 여성의 목소리보다 정확하게 인식하는 것으로 나타났는데, 남성일 경우 인식 정확도는 60%이지만, 여성의 목소리일 경우 정확도는 47%로 내려가 음성인식에서 여성이 차별을 받고 있는 것으로 나타남


이 차이가 발생하는지에 대해 시스템을 자세히 검증할 필요가 있는데, 태트먼은 AI 훈련에 사용된 음성 데이터 샘플이 성별로 균등하지 않고 남성에 치우쳤기 때문인 것으로 추측


AI의 성능은 훈련 자료의 품질에 민감하게 좌우되는데, AI의 여성 차별과 인종 차별 문제가 표면화됨에 따라, 훈련 데이터의 공정성 여부가 추궁 당하고 있음


◈ 사람의 생명과 직결되는 의료 분야에서도 인공지능에 의한 판단과 결정을 어떻게 해석하고 검증할 것인지에 대한 논의가 시작되고 있음


딥러닝 기법은 최근 유방암 검사의 판정에서 성과를 올리고 있는데, 검체의 의료 이미지(CT 촬영사진, x-레이 사진 등)를 딥러닝 네트워크에 입력하면 AI는 암이 발병한 조직을 정확하게 검출해 냄


현재 AI의 유방암 진단 정확도가 인간을 웃돌기 때문에, 많은 병원에서 정밀한 치료를 위해 이 시스템의 도입을 시작하고 있음


그러나 동시에, 건강해 보이는 조직을 AI가 암 발병 가능성이 높다고 판정한 경우, 의사와 환자가 어떻게 대응해야 할 지가 논란이 되고 있는데, AI 판정만 믿고 몸을 여는 수술을 해야 하는지 어려운 판단을 내려야 하는 압박을 받게 됨


물론 유전자 검사에서도 동일한 문제가 발생하고 있으며, 유방암 발병을 촉진하는 유전자 변이인 BRCA가 검출될 경우 수술을 해야 하는지 여부가 논란이 되고 있음


여배우 안젤리나 졸리는 BRCA1 변이 유전자를 보유하고 있으며 유방암 발생 확률이 87%라는 말을 듣고 아직 암이 발병하지 않았음에도 유방 절제술을 받은 바 있음


그러나 AI에 의한 검진의 경우는 이와 다른데, AI는 변이 유전자 보유라는 확실한 근거를 토대로 발병 확률을 제시하는 것이 아니며, 통계적 방법으로 유방암 여부를 판단할 뿐 그 조직에서 왜 암이 발병하는 지는 설명하지 않기 때문


이런 이유로 인공지능은 종종 인공 무능으로 조롱받는 것이며, 과학적 근거가 없는 결정을 어떻게 해석해야 할 지에 대해 의학적 검증 노력이 시작되고 있음


◈ 은행이나 핀테크 스타트업들도 최근 대출 심사에서 딥러닝을 사용하기 시작했는데, 심사 결과에 대해서는 대체로 만족도가 높지만 현행 법과 배치되는 문제가 발생하고 있음


AI 대출 심사의 장점은 신청자의 데이터를 알고리즘에 입력하면 즉시 위험도를 평가할 수 있고 높은 정확도로 단시간에 대출 심사가 할 수 있다는 것


한편, 미국 대부분의 주 정부는 은행이 대출 심사를 통과하지 못한 사람에게 그 이유를 설명하도록 의무화 하고 있는데, 딥러닝은 그 과정이 깜깜이여서 은행은 탈락한 신청자에게 이유를 충분한 설명하지 못하게 됨


게다가 대출 심사 기준을 바꿀 때마다 알고리즘을 재교육하는데, 소프트웨어의 로직을 변경하는 것이 아니라 대량의 데이터를 읽어 들여 딥러닝의 변수를 다시 설정하게 하기 때문에 금융업계에서 AI 도입을 두고 찬반 논란이 일고 있음


AI의 작동 알고리즘을 정확히 알지 못할 경우, 경험적으로 알게 된 AI 알고리즘의 맹점을 활용한 공격에 인증 시스템이 오작동 할 위험이 있음을 증명하는 실험도 있음


카네기 멜론 대학의 마무드 샤리프 교수 등은 안경으로 얼굴 인증 시스템이 오작동하도록 만들 수 있다는 내용을 담은 논문 최신 얼굴 인식 기술에 대한 실제적이고 눈에 띄지 않는 공격(Accessorize to a Crime: Real and Stealthy Attacks on State-of-the-Art Face Recognition)을 발표하였음


실험에 의하면 안경테의 폭이 약간 넓은 안경을 쓰면 시스템이 얼굴을 인식할 수 없게 되며, 따라서 방범 카메라의 감시 시스템을 빠져 나갈 수 있는 여지가 생김


<자료> Mahmood Sharif et al..


[그림 3] 간단한 트릭으로 얼굴인식 AI 교란


• 또한 안경테의 색 패턴을 변경하면 얼굴 인식 시스템이 다른 인물로 오인하는 것으로 나타났는데, 현란한 색의 종이로 만든 안경테를 걸치면 심지어 남성을 여성으로 잘못 인식하는 경우도 있었다고 함


얼굴 인식 시스템이 딥러닝 기법으로 얼굴의 특징을 파악한다고 하는데, 이 사례를 보면 눈매의 이미지를 판정에 사용하는 것으로 추정해 볼 수 있음


그러나 AI가 실제로 어떤 논리로 얼굴 인증을 하고 있는지는 아직 수수께끼이며, 이것이 규명되지 않는 한 얼굴 인증 시스템을 손쉽게 빠져 나가는 범죄자의 트릭을 막을 방법이 없음


AI의 작동 메커니즘이 알려지지 않는 이유는, AI의 기초를 이루는 신경망이 인간의 뇌를 본떴기 때문인데, 인간 뇌의 정보 저장 방식이 아직 밝혀지지 않았기 때문


AI의 신경망(Neural Network)으로 이미지를 판정할 때는 사진과 태그를 네트워크에 입력한 후 출력이 제대로 사진의 내용을 판정할 수 있도록 훈련시키는 과정을 거침


• 훈련 과정에서는 네트워크의 각층 사이의 연결 강도(Weight)를 조정하는데, 이러한 교육 과정은 인간의 뇌가 학습 할 때 뉴런의 연결 강도를 조정하는 움직임과 유사한 것으로 알려져 있음


학습에서 얻은 연결 강도는 각 뉴런(그림 4의 흰색 동그라미 부분)에 저장되는데, 따라서 신경망을 훈련시키는 메커니즘의 특징은 프로그램과 데이터를 한 곳에 모아 저장하지 않고 학습 데이터를 네트워크에 분산하여 저장할 수 있다는 것임


<자료> Neural networks and deep learning.


[그림 4] 인공지능 신경망의 정보 저장 구조


인간의 뇌도 동일한 방식으로 작동하는데, 가령 뇌가 전화번호를 기억할 때, 첫 번째 숫자는 다수의 시냅스에 흩어져 저장되며, 두 번째 숫자도 마찬가지로 흩어져 저장되지만 첫 번째 숫자와 가까운 위치에 저장되는 것으로 알려져 있음


문제는 뇌의 이런 저장 메커니즘이 아직 정확히 밝혀지지 않았고, 따라서 뇌의 구조를 본 뜬 신경망의 정보 저장 메커니즘의 규명이 진행되지 못하고 있다는 점


딥러닝의 문제점은 응축하자면 지식이 네트워크 상에 눌어붙어 있다는 점에서 기인하는데, 즉 지식이 수천만 개에 이르는 뉴런에 흩어져 저장되기 때문에 시스템을 개발한 인간이 아니라 네트워크가 지식을 습득한다는 데 문제의 본질이 있음


AI만이 알고 있는 답을 규명하기 위해 1990년대 초부터 연구자들이 AI의 블랙박스를 열려는 시도를 해왔는데, 규명의 과정이 곧 AI에 대한 의구심이 높아지는 과정이었음


카네기 멜론 대학은 1990년대부터 자동운전 기술의 기초 연구를 진행하고 있었는데, 당시 연구원 딘 포모루는 카메라에 포착된 영상으로 자동운전 알고리즘을 교육시켰음


몇 분간 알고리즘을 교육한 후 차량을 자동 주행시키는 시험을 반복했는데, 시험은 잘 진행되었지만 다리에 접근할 때 자동차는 도로에서 벗어나는 움직임을 보였고, 그러나 알고리즘이 블랙박스여서 그 원인을 알 수 없었음


소프트웨어를 디버깅하는 방법으로는 로직을 수정할 수 없기 때문에 포모루는 도로 도로주행 시험을 반복하며, 다양한 상황에서 자동운전을 반복하며 경험적으로 문제점을 밝혀낼 수밖에 없었음


그에 따르면 자동차는 갓길 바깥에 나있는 잔디 부분을 기준으로 주행 도로를 판정하고 있는 것으로 파악되며, 다리에 가까워지면 잔디 부분이 없어져 차로 판단 기준을 잃게 되므로 정상적인 주행을 할 수 없게 된 것임


이런 결론에 이르게 되자 포모루는 자동운전 기술을 AI로 구현한 자동차가 과연 제대로 작동할 것인지 확신할 수 없게 되었다고 함


◈ 현재에도 이와 동일한 문제에 직면하고 있는데, 무인 자율운전 차량들이 도로를 달리고 있는 지금, 사람이 AI 기술을 신뢰해야 할 지의 문제가 최대 이슈가 되고 있음


AI의 운전 로직을 모르기 가운데, 어떻게든 안전 기준을 만들려다 보니 시행착오가 계속되고 있는데, 그 중 하나는 정해진 거리를 무사고로 주행 가능하다면 안전한 것으로 간주한다는 생각임


싱크탱크 랜드 코프(Rand Corp)는 인간이 자동차를 1억 마일 운전할 때 사망 사고는 1.09 회 발생하는데, 자율운전 차량이 인간만큼 안전하다는 것을 증명하기 위해서는 2.75억 마일을 무사고로 달릴 필요가 있다는 기준안을 제시한 바 있음


인간 수준의 안전성을 입증하기 위해서는 대규모 주행 시험이 필요하다는 말인데, 이는 자율운전 자동차의 안전 기준을 설정하는 작업이 난항을 겪고 있음을 잘 보여줌


◈ 그러나 자율주행 차량의 도입과 확산을 위해서는 결국 AI의 작동 메커니즘 규명이 반드시 전제되어야 할 것이므로, 이 문제를 기술적으로 해명하려는 움직임도 시작되었음


엔비디아(Nvidia)는 딥러닝을 이용한 자율운전 기술을 개발하고 있는데, 이 시스템의 명칭은 데이브-2(DAVE-2)이며 신경망으로 구성되어 있음


인간이 알고리즘에 주행 규칙을 가르치는 것이 아니라, 시스템이 신경망에서 이미지를 처리하여 안전한 경로를 파악하는데, 가령 곡선 도로의 이미지를 읽으면서 거기에서 운전할 때 알아야 할 필요가 있는 도로의 특징을 파악함


엔비디아는 AI가 어떤 기준으로 결정하고 있는지에 관한 연구를 함께 진행하고 있는데, 지금까지 블랙박스였던 AI의 핵심을 규명하는 시도임


• 연구의 결과, 엔비디아는 카메라가 포착한 사진과 이미지 인식 신경망(CNN)이 이것을 읽고 거기에서 추출한 특징을 비교해서 보여주며, AI가 도로를 어떻게 이해하고 있는지를 설명하고 있음


신경망이 보여 주는 굽은 도로의 특징을 보면, 특징량은 곡선이 대부분으로 CNN이 도로의 경계 부분을 기준으로 운전하고 있음을 알 수 있는데, 이런 방법을 통해 AI가 습득한 운전 기술의 요체를 사람이 시각적으로 이해할 수 있다는 설명



<자료>Nvidia.


[그림 5] AI가 도로를 인지하는 방법



2016년이 인공지능의 가능성을 열어젖힌 원년이라면, 2017년은 AI의 블랙박스를 열어 그 작동 논리를 규명함으로써 AI 확산의 기폭제를 마련하는 해가 될 것으로 예상


자율운전 자동차를 포함 자율적 인공지능 시스템은 심층강화학습(Deep Reinforcement Learning)이라는 기법을 사용하여 알고리즘이 시행착오를 반복하여 정책을 학습하도록 하고 있음


심층강화학습 기법은 알파고에도 사용되고 있으며, 보다 지능적인 AI 개발의 핵심 기법이 될 것으로 보이는데, 현재 심층강화학습의 요체도 블랙박스이지만, 앞으로 이에 대한 규명 작업도 적극 진행될 것으로 예상됨


무언가 새롭고 획기적인 것인 등장했을 때, 그것의 요체와 작동 방식을 정확히 모른다면 사람들의 대응 방식은 무조건적인 거부 혹은 반대로 종교와 유사한 무조건적 추종과 같은 극단적 양상을 띨 위험이 있음


인공지능이 사회적 합의 위에 다양한 가치를 위해 활용되려면, 그 메커니즘에 대한 정확한 이해가 수반되어야 할 것이며, AI가 인간의 뇌를 본 뜬 것인 만큼, AI를 알아가는 과정은 곧 우리 인간이 스스로에 대해 더 많이 알게 되는 과정이 될 수 있을 것임

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1776호(2016. 12. 14 발행)에 기고한 원고입니다. 


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

인공지능 접목으로 유연성 높아지는 보안시스템.pdf



[ 요 약 ]


지금까지 보안 시스템은 새로운 해킹 수법이 등장하면 이를 최대한 신속하게 감지하고 대응책을 마련한 후 배포하는 수동적 방식이었음. 그러나 최근 인공지능(AI) 기술이 발전하고 활용 범위가 넓어지면서 보안 분야에서도 AI를 접목하려는 시도가 활발히 전개되고 있는데, 바둑 AI 알파고와 유사한 방식으로, 인공지능에 대규모의 침해 패턴을 학습시킴으로써 스스로 방어 규칙을 생성하여 신속히 대처할 수 있는 유연한 보안 시스템을 구축하려는 노력이 대표적



  [ 보 안 ]

 

  ◈ 기계학습의 발전에 따라 보안 시스템에 대한 훈련이 쉬워지게 되었고, 그 결과 보안 시스템은 상황의 변화에 이전보다 유연하게 대응할 수 있는 환경을 갖추게 되었음


보안 솔루션들에서 한가지 공통적인 태스크는 새로 다운로드 받거나 설치한 응용프로그램의 악성 여부를 판정하는 것임


지금까지의 접근 방식은 지극히 기본적인 일종의 전문가 시스템으로, 응용프로그램의 서명이 그 동안 알려진 멀웨어의 패턴과 일치하는지 여부를 조사하는 것임


하지만 이러한 표준적인 바이러스 대응 방식은 약점이 있는데, 새로운 멀웨어의 출현에 맞춰 지속적으로 업데이트가 필요하다는 점과 틈이 생기기 쉽다는 점


, 멀웨어에 아주 작은 수정만 가하더라도 감지 기능을 쉽사리 빠져나가기 때문에 시스템이 침투당하게 되는 약점이 있음


◈ 딥러닝(Deep Learning)의 방법으로 이런 약점을 해결하는 것을 목표로 하고 있는 스타트업 중 주목받고 있는 곳 중 하나는 이스라엘의 딥 인스팅크트(Deep Instinct)


보안 시스템의 훈련에 사용할 수 있는 멀웨어 표본 중 지금까지 알려진 것은 약 10억 개에 이르는데, 딥 인스팅크트는 이를 활용한 문제 해결을 시도하고 있음


딥러닝은 다양한 분야에 혁명적인 변화를 가져오고 있는데, 가령 컴퓨터 비전은 매년 20~30%의 진화를 이루고 있으며, 인간의 영역을 넘어서는 시각적 능력에 이르는 것도 시간문제라는 전망이 나오고 있음


음성인식 분야 역시 딥러닝을 통해 급속한 발전을 이루고 있는데, 이와 같은 일이 사이버 보안 영역에서도 일어나지 않을 이유가 없다는 것이 딥 인스팅크트의 출발점


물론 이 스타트업은 확률 기반의 기계학습 시스템에도 한계는 있다고 말하고 있는데, 우선 최적의 결과를 내기 위해 인간 전문가가 식별하고, 가중치를 두고, 튜닝해야 할 많은 요소들이 너무 많이 있다는 것


<자료> CIO


[그림 1] AI 진화의 3단계(기계학습 시스템이 개와 고양이를 구분하는 방식의 진화)


• 반면 역시 셀 수 없는 많은 요소들이 너무 사소하거나 관련이 없는 것으로 버려지고 있는데, 딥 인스팅크트는 대부분의 데이터가 버려지고 있다고 보고 있음


◈ 딥 인스팅크트가 채택한 방식은 멀웨어로 알려진 표본 모두를 이 기업 연구소의 딥러닝 시스템에 훈련시키는 것임


이 훈련 과정에는 약 하루가 소요되고 데이터 분석에는 고성능 GPU가 필요한데, 훈련 결과 얻게 되는 시스템 크기는 약 1 기가바이트로 대부분의 응용프로그램에 사용하기에는 너무 크기 때문에, 이 기업은 약 20 메가바이트 정도로 크기를 줄였음


그 결과, 모바일을 포함한 모든 최종 단말 장치에 설치할 수 있게 되었으며. 처리 속도가 느린 장치에서도 침입해 오는 위협을 몇 밀리 세컨드 안에 분석 가능하게 되었음


보통의 파일 크기는 1 메가바이트 가량이기 때문에 탐지와 분석에는 1 밀리 초도 채 걸리지 않는데, 복잡한 처리는 연구소의 첨단 인프라에서 수행되고 고객 쪽에 설치되는 것은 매우 작은 처리장치이며, 고객들이 모든 복잡한 부분을 다 보는 것은 아님


<자료> Deep Instinct


[그림 2] 딥 인스팅크트의 딥러닝을 이용한 보안 시스템


• 반면 연구소에서는 새로운 멀웨어 표본 데이터를 축적하고, 3~4 개월마다 최종 단말의 각 장치에서 작동하는 두뇌에 업데이트를 일괄 배포하는데, 흥미로운 점은 두뇌를 6개월간 업데이트 하지 않더라도 새로운 멀웨어 파일을 탐지할 수 있다는 것


◈ 공격자가 수정을 가해 새로운 멀웨어 변종을 만들어 내더라도 탐지에 전혀 문제가 없다는 점이 바로 보안 시스템에서 기계학습 방식의 매우 우수한 장점임


매일 엄청난 수의 새로운 멀웨어 표본이 출현하고 있지만, 그 대부분은 기존의 멀웨어를 극히 경미하게 변화시키고 있을 뿐임


실력 있는 공격자나 국가 주도로 새로운 제로-데이 공격을 하더라도 80%는 기존의 공격과 같은데, 지금까지의 보안 기법에서는 이를 검출하지 못했지만 딥러닝은 쉽게 검출할 수 있음


딥 인스팅크트는 현재 써드파티 테스트 기관과 공동으로 딥러닝 방식의 결과를 정량화 하는 작업을 진행 중인데, 포춘500대 기업에 속한 고객사를 대상으로 한 초기 테스트 결과 기존 솔루션에 비해 멀웨어 검출율이 20~30% 높게 나타났다고 함


딥 인스팅크트는 미국의 한 대형 은행에서 10만 개의 파일에 대한 테스트를 실시했는데, 은행이 사용하던 기존 보안 솔루션은 테스트 당일 아침 최신 업데이트를 했고, 자신들의 솔루션은 마지막 업데이트가 2개월 전에 이루어진 상황


그러나 검출율은 기존 솔루션이 40%였던 반면, 딥 인스팅크트의 솔루션은 99.9%로 시시각각 생성되는 새로운 멀웨어를 거의 모두 감지한 것으로 나타남


이 대목에서 하나 재미있는 것은, 비록 딥러닝 방식이 적용되어 검출에 성공했다 하더라도, 어떻게 검출했는지 그 과정이 반드시 설명되는 것은 아니라는 점


◈ 딥러닝 시스템이 가지는 약점 중 하나가 해답에 이르는 길을 명확히 설명할 수 없다는 것이긴 하지만, 반대로 정확한 설명을 목표로 하는 제품도 있음


미국의 스타트업 뉴토니안(Nutonian)이 독자적으로 개발한 인공지능(AI) 엔진 유레카(Eureqa)는 어떤 일들이 왜 일어났는지를 찾아내는 것이 주 업무임


무슨 일이 있었는지, 그들 사이의 관계는 무엇인지에 대해 가장 간단하고 우아한 설명 방법을 찾는 것이 유레카의 목표인데, 가령 물리적 데이터를 제공하면 유레카는 뉴턴의 운동 법칙을 재발견 할 수 있다고 함


뉴토니안은 유레카 AI 엔진을 연구자에게 무상으로 제공하고 있는데, 유레카를 이용한 연구가 학술 논문에서 다루어 진 사례는 이미 500건 이상으로, 가령 의학 분야에서 노화에 따른 시력감퇴나 맹장염 등의 질병을 진단하는 새로운 모델을 찾는 데 도움을 유레카는 도움을 주고 있음


이 유레카는 사이버 보안 영역에서도 응용할 수 있는데, 가장 어려운 문제 중 하나인 사이버 공격의 구조를 분절하는 프로세스에 유레카 AI를 응용하면 이 절차를 자동으로 처리 할 수 있음


유레카는 클라우드 기반 서비스 형태로 가입 고객에게 제공되는데, 최초 데이터의 조사에만 1시간 정도 소요될 뿐 그 이후에는 매우 신속하게 답변을 얻을 수 있으며, 이전에는 몇 달 혹은 몇 년씩 시간을 들여 얻은 결과를 몇 분 만에 얻을 수 있다고 함


◈ 약간씩 수정된 변종은 딥러닝으로 자율 탐지가 가능하다 해도, 사이버 보안의 세계는 상황이 급변하기 때문에 어떤 기계학습 시스템이라도 정기적인 업데이트가 매우 중요함


사람들의 생각과 행동은 항상 이전과 전혀 다른 새로운 것으로 인해 변화해 나가는 만큼, 정기적인 업데이트 없이는 시스템이 노후화 해 버리기 때문


기업의 직원들은 새로운 일들을 시작하며, 벤더는 응용프로그램을 개편하고, 소비자는 구매 패턴을 바꾸며, 해커는 기존의 시스템을 회피하기 위해 특별히 고안된 새로운 멀웨어를 끊임없이 만들어 내고 있음


상황이 이렇다 보니 보안 벤더들은 드러난 문제들을 모두 해결한 업데이트 버전을 개발하는데 시간을 소요해야 하며, 다음 번 업데이트가 나올 때까지 시스템에 상당한 취약 기간이 발생할 수 있음


통상 해커들은 보안 소프트웨어를 구매한 다음 이를 깰 방법을 찾아낼 때까지 다양한 공격을 시도하며, 방법을 알아내면 다음 번 업데이트가 나올 때까지 해당 소프트웨어의 모든 고객들을 표적으로 공격을 할 수 있음


이런 문제를 해결하기 위한 방법의 하나로 미국의 매서지 커뮤니케이션(Masergy Communications)은 현재 대다수 보안 제품 벤더가 채택하고 있는, 모든 고객을 획일적으로 방어하는 방식에서 탈피할 것을 제안하고 있음


◈ 매서지 커뮤니케이션은 사내 패턴, 유사 기업 패턴, 산업 전체 패턴, 글로벌 패턴을 알아내는 작업을 하고, 각각 다른 주기로 업데이트 하는 방법을 제안하고 있음


매서지는 일정 수의 글로벌 요인을 이용하여 의심스러운 동작이 발생할 가능성을 탐색한 후, 이를 기업의 고유한 로컬 지표와 함께 조합함


글로벌 시스템이 살필 수 있는 입력 정보의 수에는 한계가 있고 공간이 매우 넓기 때문에 우선은 출현 빈도가 높은 특징들만 탐색함


그 다음엔 로컬에 초점을 맞추며 보다 많은 정보 입력을 받게 되는데, 로컬 모델에서는 정보들을 압축하여 보다 작은 특징의 집합으로 압축할 필요가 없으며, 이를 통해 고객별 특수성과 훨씬 높은 정확성을 얻을 수 있음


◈ 로컬 및 글로벌을 결합하는 기술은 미국의 어큐어티 솔루션(Acuity Solutions)도 이용하고 있는데, 이 회사는 기계학습을 활용하여 사이버 위협을 탐지하는 장비를 개발함


이 기업이 개발하는 블루벡터(BluVector) 시스템은 미국 정부기관의 첨단 연구 프로그램을 기반으로 하고 있으며, 다년간 개발된 우수 소프트웨어를 이용하여 잘 짜인 코드의 양상이 어떤 것인지를 학습함



<자료> Acuity Solutions.


[그림 3] 어큐어티 솔루션의 블루벡터 시스템


• 블루벡터의 엔진은 코드의 일부를 검사한 후, 잘 짜인 코드라면 보통 있어야 할 특징들이 이 코드 조각에 있는지 여부를 판정하여 알려주는 기능을 수행하며, 또한 이 과정에서 각 고객으로부터 새로운 학습을 엔진에 내재화함


어큐어티 솔루션은 고객에게 제공하기 전에 엔진을 사전에 훈련시키지만 그 이후부터 엔진은 마치 둥지를 떠난 아이처럼, 고객의 환경 속에서 학습을 계속하게 됨


주 엔진은 글로벌 데이터를 기반으로 분기 마다 업데이트가 적용되지만, 각 고객사에만 해당되는 시스템 내에서 공유되지 않음


, 이 제품은 고객의 환경에 따라 조금씩 다르게 구축되며, 개별 고객에 맞게 특수하게 맞춤화 되는 것이고, 따라서 해커가 이 제품을 구입하여 방어를 빠져 나갈 수 있는 코드를 발견하더라도 별다른 도움이 되지 않음


어큐어티 솔루션에 따르면, 이것은 이동형 방어 시스템이며, 고객의 환경에만 특화된 기술이기 때문에 리버스 엔지니어링은 불가능함


AI를 적극 수용하려는 최근의 보안 업계 움직임에 대해, 일부 전문가들은 보안 분야에서 AI는 만능이 아니라며 마케팅 차원에서 AI가 남용되는 현상에 우려를 표하기도 함


보안 전문기업 트렌드 마이크로는 보안 기술은 AI에 한정할 수 없으며, 패턴 매칭, 행동 검지, 웹 평판, 포렌식, 샌드박스 같은 대응 기술들은 보안이라는 큰 틀 내에서 모두 특기나 적용되는 맥락이 다른 것이라고 지적


또한 최근 기계학습이나 딥러닝을 응용한 보안 어플라이언스이나 클라우드 기반 보안 시스템이 잇따라 등장하는 것에 대해서도, 자체 조사결과 실행파일 형태의 멀웨어 탐지 능력은 높지만 스크립트나 매크로 형태의 멀웨어는 거의 감지 못했다고 설명


트렌드 마이크로는 최신 AI 기술을 사용하지 않은 보안 솔루션이라고 해서 안전하지 못하다고 말할 수는 없으며, 한 물 간 것으로 치부되는 기존 기술을 AI와 조합해 다층적인 방어 시스템을 구축하는 것이 필요하다고 주장


공격을 하는 것은 실제로 릴레이 서버나 멀웨어가 아니라 그 뒤에 있는 사람이고 사람은 AI보다 훨씬 지능적이기 때문에, 성숙한 기술과 새로운 기술을 결합해 몇 단계의 방어막을 통해 해커들에게 스트레스를 주고 침해 동기를 없애는 것이 중요하다는 것


◈ 그러나 향상된 AI 기술이 보안 기술에 적용됨에 따라 사이버 보안 시스템이 보다 신속하고 유연한 대응이 가능해지게 될 것이라는 점에는 대부분의 전문가들이 동의


알파고를 통해 널리 알려진 딥러닝 기술 즉, 수 많은 패턴을 학습한 후 스스로 규칙을 생성해 주어진 태스크를 처리하는 능력은 보안 분야에도 적용되어 기존의 방식보다 더 나은 성과를 낼 수 있음이 확인되고 있다는 것


지금까지 사이버 보안이 새로운 형태의 창이 등장하면 그것을 막기 위해 방패를 수정하는 수동적 방식이었다면, AI의 적용을 통해 확률 높은 임기응변적 대응과 나아가 새로운 창의 형태를 예측할 수 있는 선제적 방식으로 변화할 가능성도 보이고 있음


보안 기술의 접근성 측면에서도, 향상된 클라우드에 AI 기술이 탑재되면서 모바일 네트워크에 접속된 모든 기기에서 최신의 보안 기술을 동시에 이용할 수 있는 환경이 구축되고 있다는 것은 큰 발전으로 볼 수 있음


이런 점을 긍정적으로 보아 벤처캐피털들은 2017년 사이버 보안 시장은 인공지능(AI)이 지배하게 될 것이란 전망을 내놓고 있음


◈ 반면 보안 시스템에서 AI의 활용이 점차 늘어가는 상황은 향후 사이버 보안 분야에서도 AI가 인간을 대체할 가능성이 있음을 시사한다는 점은 곱씹어볼 필요가 있음


지금까지 사이버 보안은 프로그래밍이 탁월한 사람과 사람 사이의 경쟁이라는 인식이 강했으나, 점차 방어에서 인공지능의 역할이 늘어나게 될 가능성이 엿보이고 있음


물론 현 단계에서 인간과 AI의 해킹 공격과 방어 실력은 큰 차이가 나기 때문에 동등한 수준에서 논의할 수는 없지만, 알파고의 사례에서 보듯 아직 멀었다고 느낀 거리가 어느 시점에 좁혀질 지는 예측하기 어려움


기술 발전에 따른 인간 노동의 대체 효과가 기술이 단순 노동을 대신할 때보다 사람의 지식과 경험이 녹아 있는 일을 대신할 때 극대화된다는 점을 감안하면, 장기적으로 사이버 보안 본야 역시 AI의 역할이 커질 것으로 예상해 볼 수 있음


또한 IoT의 본격화에 따라 침해 대응을 해야 할 기기의 수가 기하급수적으로 늘어날 것이고, 해킹에 의한 피해 규모를 가늠할 수 없는 위험사회에 접어들고 있다는 점을 고려하면, 사람에 의한 대응 보다는 AI에 의한 대응이 보다 더 적합할 수도 있을 것임