※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1843호(2018. 4. 25. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

퀄컴 IoT 센서 전용의 신형 칩 발표, AI 보안 카메라 등 개발 촉진.pdf



ž 퀄컴은 IoT 엣지 디바이스의 비전 처리 전용 브랜드로 Qualcomm Vision Intelligence Platform을 만들고, 그 첫번째 행보로 SoC(시스템온칩) 제품 2개를 발표하였음


Ø 퀄컴은 칩뿐만 아니라 관련 소프트웨어도 제공하며, 이 중에는 학습된 신경망을 SoC에 구현하여 AI 추론을 실행하는 소프트웨어도 포함되어 있기 때문에, 칩과 소프트웨어를 조합하면 가령 AI 보안 감시 카메라의 개발을 보다 용이하게 할 수 있음


Ø 퀄컴은 Vision Intelligence Platform(비전 인텔리전스 플랫폼)의 응용분야로 산업 및 생활용 감시 카메라와 스포츠 카메라, 웨어러블 카메라, 360도·180도 가상현실(VR) 카메라, 로보틱스, 스마트 디스플레이 등을 꼽고 있음


<자료> Future Source


[그림 1] QCS605칩과 360 VR 카메라


Ø 퀄컴의 보도자료에 따르면 카메라와 스마트 도어락 제품을 판매하는 리코(RICOH)와 중국 KEDACOM(Keda Communications) 등이 비전 인텔리전스 플랫폼을 이용해 다양한 카메라 기기를 개발할 계획임


Ø 이번에 발표된 2 종류의 SoCQCS605QCS603은 모두 삼성전자의 1세대 10nm FinFET 공정(10LPE)에서 제조하게 되며 현재 샘플 제품을 출하 중에 있음


Ø 퀄컴과 대만의 알텍(Altek)은 현재 QCS605를 기반으로 한 360 VR 카메라의 레퍼런스 디자인을 제공 중이며, QCS603을 기반으로 한 산업용 감시 카메라의 레퍼런스 디자인은 2018년 하반기에 제공할 예정임


ž 비전 인텔리전스 플랫폼에서 주목 받고 있는 AI 추론 처리는 퀄컴AI 엔진을 통해 제공되는데, 퀄컴은 학습된 신경망을 AI 엔진에 맞게 최적화하는 소프트웨어도 제공하고 있음


Ø QCS605QCS603은 모두 퀄컴의 스마트폰용 SoC스냅드래곤(Snapdragon) 프로세서에서 이동통신(LTE)용 모뎀 회로를 제외했을 뿐 동일한 칩 내부 구성을 채택하고 있는데, QCS605가 상위 제품으로 QCS603보다 동작 주파수가 높고 기능이 많음


Ø CPU 코어를 예로 들면, 두 칩 모두 ARMv8-A 아키텍처에 퀄컴 독자적인 마이크로 아키텍처인 카이로(Kyro) 300을 통합했으나, 상위 제품인 QCS605는 동작 주파수 2.5GHz카이로 300 골드 2개와 동작 주파수 1.7GHz카이로 300 실버 6개 등 총 8코어로 구성


Ø 반면 하위 제품인 QCS603은 동작 주파수 1.6GHz카이로 300 골드 2개와 동작 주파수 1.7GHz카이로 300 실버 2개 등 총 4코어 구성을 채택하였음


Ø CPU 코어를 제외하면, 두 제품 모두 GPU 코어로는 퀄컴 아드리노(Adreno) 615, DSP(디지털신호처리) 코어로는 퀄컴 헥사곤(Hexagon) 685 벡터 프로세서, ISP(이미지신호처리) 프로세서로는 퀄컴 스펙트라(Spectra) 270을 탑재하고 있음


Ø 이 밖에 IEEE 802.11ac 지원 와이파이 회로(QCS605 2×2 MIMO 지원), 블루투스 5.1 회로, GNSS(글로벌 내비게이션 위성 시스템) 수신 회로, 동영상 압축 신장 회로, 오디오 처리 회로, 디스플레이 출력 회로 등을 탑재하고 있어 기능은 매우 풍부한 편


Ø 비전 인텔리전스 플랫폼의 AI 추론 처리가 이루어지는 퀄컴 AI 엔진 시스템에서는 신경망 처리 전용 회로가 아닌 앞서 기술한 CPU 코어, GPU 코어, DSP 코어 등 3종의 프로세서 코어를 이용함


Ø 구체적으로 살펴보면 스냅드래곤 신경 처리 엔진(Neural Processing Engine, NPE)이라 불리는 소프트웨어가 학습된 신경망을 3종의 프로세서 코어에 분산하는 형태로 구현함


Ø 이를 위해 퀄컴은 텐서플로우(Tensorflow)나 카페(Caffe) 등 업계 표준 프레임워크를 통해 학습된 신경망을 AI 엔진에 최적화하는 소프트웨어도 함께 제공하고 있음


ž 한편, 반도체 소프트웨어 프로그래밍 업체인 카덴스 디자인 시스템(Cadence Design Systems)도 비전 처리 및 AI 추론 처리를 위한 DSP 코어 신제품을 발표하였음


Ø 신제품 텐실리카 비전(Tensilica Vision) Q6 DSP(이하 비전 Q6)DSP 연산을 수행하는 회로로, 비전 처리 및 AI 추론 처리용 IC 설계 시에 이용됨


Ø 이전 제품인 비전 P6 DSP에 비해 연산 성능이 1.5, 전력 효율이 1.25배 증가하였는데, 16nm FinFET 프로세스에서 비전 Q6를 구현하는 경우 최대 동작 주파수는 1.5GHz


Ø 카덴스 측에 따르면 비전 Q6는 비전 P6와 마찬가지로 단독으로 비전 처리나 AI 추론 처리도 가능하지만, 규모가 큰 CNN(Convolutional Neural Network)을 처리하는 경우 상위제품인 비전 C5 DSP와 조합하여 사용하는 것이 효율적이라고 함


Ø 비전 Q6P6가 는 256 병렬 처리가 가능한 반면 비전 C5 1024 병렬 처리가 가능하기 

때문인데, 단 그렇기 때문에 비전 C5는 소형화 면에서 칩 면적이 커지는 단점은 있음


<자료> Cadence IP


[그림 2카덴스 디자인 시스템의 DSP 제품별 주 사용 용도


ž DSP 코어 신제품은 AI 추론 처리를 위한 지원 기능이 풍부해졌으며, 카덴스는 비전 처리나 광범위한 데이터 처리를 위한 다양한 개발 플로우도 준비하고 있음


Ø 추가된 지원 기능 중 대표적인 것은 안드로이드 신경망(Android Neural Network, ANN) API 지원으로, 안드로이드용 앱에서 비전 DSP의 호출이 용이하게 되었음


Ø 또한 대응 가능한 학습 프레임워크도 늘었는데, 지금까지 지원한 카페 외에도 텐서플로우와 텐서플로우 라이트도 지원함


Ø CNN 중에 사용자 고유의 커스텀 계층을 넣는 작업도 쉽게 할 수 있게 했는데, MobileNet, SegNet, YOLO 등 업계에서 잘 알려진 학습된 CNN의 동작 검증을 시행할 수 있음


Ø 카덴스 측은 학습된 신경망에서의 개발 흐름뿐만 아니라 비전 처리나 광범위한 데이터 처리를 위한 개발 플로우도 준비하고 있는데, OpenCL 또는 C/C++, OpenVX 등으로 작성한 디자인도 DSP에 구현할 수 있게 하려는 것임

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1837호(2018. 3. 14. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

소니, 사내 AI 인재 양성 위해 사용하기 쉬운 딥러닝 도구 개발.pdf



ž 외부에서 구하기 어려운 인공지능(AI) 응용 인력을 확보하기 위해 소니는 사내 직원들의 AI 응용 감각을 훈련시키기 위한 도구를 자체 개발하였음


Ø 기계학습을 비롯해 AI를 기존 비즈니스에 활용하기 위해 각 기업들은 AI 인재의 확보에 열을 올리고 있는데, 특히 중요하게 생각하는 인력은 자사의 제품 및 기업의 핵심 과제와 AI 기술 사이의 친화성을 적절하게 평가할 수 있는 AI 응용 인재


Ø 그러나 AI 기술을 자사 제품과 연계하려면 제품에 대해 정확히 이해하고 있어야 하고, 기업의 핵심 과제는 내부 기밀의 성격도 있어 외부로 공개되지 않아야 할 필요가 있는 만큼, AI 응용 인재는 본질적으로 외부에서 구하기 어렵다는 문제가 있음


Ø 이런 딜레마를 해결하기 위해 소니가 찾은 해결책은 사내 직원들이 딥러닝(Deep Learning)의 응용 감각을 연마할 수 있는 훈련 도구를 자체 개발하여 배포하는 것이었음


Ø 소니는 우선 2017 6월에 딥러닝 라이브러리인 Neural Network Libraries(NNL)을 오픈소스 소프트웨어로 공개하였음


<자료> Futurism


[그림 1] 소니의 딥러닝 라이브러리 NNL


Ø 이 라이브러리를 이용하면 기본적인 DNN(deep neural network) 이외에 RNN(recurrent neural network), GAN(generative adversarial network) 등 다양한 딥러닝 모델을 설계할 수 있음


Ø 개발된 모델은 C++ 언어의 소스 코드로 출력이 가능하며, 변환의 번거로움 없이 스마트폰을 비롯한 다양한 디바이스에 탑재할 수 있는 장점이 있음


Ø 이어 2017 8월에는 GUI 환경에서 NNL의 기능을 사용할 수 있는 통합 개발 도구 Neural Network Console(NNC)도 오픈소스로 공개했는데, 딥러닝 개발의 사실상 표준 언어인 파이선(Python)을 배우지 않아도 GUI를 통해 직관적인 개발이 가능하게 되어 있음


<자료> Futurism


[그림 2 NNL 이용 통합개발기구 NNC


ž NNL은 현재 소니 그룹 내에서 약 1천 명이 사용 중이며, AI 개발 경험이 없는 개발자가 NNL을 이용해 3개월 만에 제품 탑재가 가능한 인식 시스템을 개발한 사례도 있다고 함


Ø NNL은 원래 딥러닝 연구개발을 효율화 하려는 목적으로 소니의 R&D 팀이 사내에서 개발 한 라이브러리인데, 소니가 2010년경부터 기존의 기계학습 기술을 점차 딥러닝으로 대체하면서 개발자용 소프트웨어의 정비를 진행해왔음


Ø 소니 그룹의 NNL 사용자는 이미 1,000명 이상으로 확산되고 있다고 하며, 소니 그룹 내 다양한 사업분야에서 NNL NNC를 이용한 제품 개발 실적이 나오고 있다고 함


Ø 가령 2018 1월에 소니가 출시한 아이보(aibo) 로봇에 탑재된 이미지 인식 기능은 NNL을 이용해 개발된 것임


Ø 그 밖에 소니의 스마트폰 Xperia시리즈에 탑재하는 AR(증강현실) 사진 촬영 앱인 AR 이펙트와 블루투스 헤드셋인 Xperia Ear를 이용해 머리 움직임을 인식하는 헤드 제스처 인식 기능, 소니 부동산의 부동산 가격 추정 엔진 등의 개발에 이 도구들이 이용되었음


Ø 기계학습의 초보자도 개발을 쉽게 할 수 있도록 하기 위해, NNC는 다운로드 하여 사용하는 윈도우 버전 외에 GPU에 의한 학습이 가능한 클라우드 버전(오픈 베타)으로도 제공되고 있음


Ø 딥러닝 개발 프레임워크는 소니 외에도 이미 여러 기업이 OSS로 공개하고 있는데, 캘리포니아 대학 버클리 캠퍼스의 카페(Caffe)와 구글의 텐서플로우(TensorFlow), 프리퍼드 네트웍스(Preferred Network)s체이너(Chainer) 등이 대표적임


Ø 이들 타사의 개발 환경에 대해 소니는, 기계학습에 익숙한 사용자에게는 상당히 사용하기 쉬운 면이 있지만, 경험이 전혀 없는 초보자에게는 도구의 동작 환경을 갖추는 것 자체가 장벽일 정도로 어려운 면이 있다고 평하며, NNL NNC의 접근 용이성을 강조하고 있음


ž 소니는 사용하기 쉬운 AI 개발 도구가 더 혁신적인 AI 응용 사례를 만들어 낼 것이라 보고 있으며, 무료 공개를 통해 내부 인재 육성뿐 아니라 미래 인재 확보도 도모하고 있음


Ø 딥러닝의 도입을 저해하는 요인 중 하나로 그 작동 메커니즘을 알 수 없는 블랙박스 시스템을 제품과 서비스에 적용할 수는 없다는 기존의 개발 관행이 거론되기도 함


Ø 가령 기존의 인식 기술은 대상을 상세하게 분석하고 표현력이 높은 특징량과 판별이 정확한 감식기를 세밀하게 조정하면서 정확도를 향상시켜 개발하는 것이 일반적이었음


Ø 이에 비해 딥러닝의 개발에서는 학습시키는 교사 데이터의 양과 질이 학습을 마친 모델의 성능을 크게 좌우하는, 즉 데이터 수집 자체가 개발 완성도와 직결되는 방식임


Ø 양자의 개발 스타일에 차이가 있기 때문에, 기존 기계학습 기술에 익숙한 전문가의 경우 과거의 지식을 버리고 데이터 기반 방식으로 전환하는 것에 심리적 저항이 많다고 함


Ø 이러한 상황 때문에 소니 측은 오히려 기계학습 경험이 없는 젊은 개발자들이 딥러닝의 개발 사상에 거부감이 없다고 보고 있으며, NNL NNC를 젊은 층이 많이 활용해 줄 것을 기대하고 있음


Ø 소니는 직원들에게 우선은 자신의 업무과 직결되지 않더라도 가령 간단한 이미지 인식 모델의 개발부터 시작해 효과를 직접 경험해 볼 것을 권고하고 있는데, 어느 정도 숙달되면 자신의 업무에 적용할 아이디어를 떠올릴 수 있게 될 것으로 보기 때문


Ø 소니가 NNL NNC를 오픈소스로 공개한 배경에는 내부 인재 육성뿐 아니라 미래 인재 확보의 목적도 있음


Ø 지금까지 소니는 자신들의 AI 관련 연구개발 성과를 대외적으로 어필해 오지 않았지만, 이번 도구의 공개를 계기로 다시 한번 소니의 기술력을 주목하게 함으로써 향후 딥러닝을 하고 싶어 하는 인재들이 소니를 선택하게 하는 계기로 만들고자 하는 것임

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1833호(2018. 2. 14. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

AI로 AI를 개발하는 기술의 진전, 성당에서 시장으로 나오는 AI.pdf



[ 요 약 ]


현재의 범용 신경망이 제공하는 기능이 불충분하다고 느낄 경우 특정 용도의 고도 신경망을 개발할 필요성이 대두되나신경망을 새롭게 최적화하는 작업을 수행할 수 있는 AI 연구자는 극소수이고 개발 기간도 오래 걸리는 문제가 있음최근 구글은 사람이 아닌 AI가 신경망 고도화 작업을 수행하도록 하는 기술을 클라우드 서비스 형태로 공개하였는데누구나 쉽게 특정 용도의 AI를 개발할 수 있게 됨에 따라 더욱 혁신적인 AI가 출현할 가능성이 높아지고 있음


[ 본 문 ] 


ž 미국의 오크 릿지 국립 연구소(Oak Ridge National Laboratory)는 기존 범용 신경망을 이용한 연구에 한계가 있음을 느끼고 과학 연구 전용의 고도 신경망 개발에 나서게 있음

Ø 오크 릿지 연구소는 미국 에너지부 산하 기관으로 과학의 수수께끼 규명을 목표로 하고 있는데, 세계 최고 수준의 수퍼 컴퓨터인 타이탄(Titan)을 운용하는 곳으로도 유명함



<자료> Wikimedia Commons

[그림 1] 수퍼 컴퓨터 타이탄


Ø 타이탄은 크레이(Cray) 사가 개발했으며, 18,688개 노드로 구성된 병렬 머신으로 각 노드에 CPU(AMD 옵테론) GPU(엔비디아 케플러)를 탑재한 세계 최대 규모의 수퍼 컴퓨터임


Ø 이 연구소는 몇 년 전부터 최근 급속히 발전한 이미지 인식과 음성 인식 신경망을 이용한 연구를 진행해 왔으나, 상용화된 범용 신경망을 기초과학 연구에 적용한 결과 기대한 만큼의 성과는 얻을 수 없었다고 함


Ø 그 이유는 과학 연구에서 다루는 데이터의 특수성과 신경망 교육에 사용할 수 있는 데이터의 수가 제한되어 있기 때문이었으며, 따라서 오크 리지 연구소는 과학 연구를 위한 전용 신경망 개발의 필요성에 직면하게 되었음


Ø 이에 따라 오크 릿지 연구소는 타이탄을 이용해 과학 연구에 적합한 고정밀 신경망을 개발하게 되었으며, 현재 이를 활용해 물질과학 및 입자 물리학의 연구를 진행하고 있음


ž 오크 릿지 연구소가 과학 전용의 신경망 개발에 있어 수퍼 컴퓨터를 이용한 부분은 신경망 최적화 단계로, 이전까지 인간이 담당하던 작업을 AI를 이용해 실행한 것이 특징


Ø 연구진은 특정 데이터 세트에 대해 최적의 신경망이 존재한다는 전제에서 그 구조를 탐구 해 왔는데, 이 연구는 소위 하이퍼 파라미터 최적화(Hyper-Parameter Optimization, HPO)의 문제로 귀결됨


Ø 하이퍼 파라미터는 신경망의 기본 모델, 즉 신경망 각층의 종류와 그 순서, 네트워크의 층수 등을 의미하며, HPO는 이들 기본 요소를 조합하여 네트워크를 최적화하는 작업임


Ø 달리 표현하면, 대부분의 기계학습 알고리즘에서는 연구자들이 지정해 두어야 할 설정들이 많은데 이런 다양한 튜닝 옵션들을 하이퍼 파라미터라 부르며, 성능을 최적화하거나 편향과 분산 사이의 균형을 맞출 때 알고리즘을 조절하기 위해 HPO를 수행함


Ø 성능 최적화를 위해 하이퍼 파라미터를 튜닝 하는 것은 연구자들 사이에서는 예술이라 불릴 만큼 어렵고 정교한 작업이며, 어떤 데이터 세트에서 최고의 성능을 보장하는 쉽고 빠른 튜닝 작업 방법은 없는 것으로 알려져 있음


<자료> IBM

[그림 2] 하이퍼 파라미터 최적화


Ø 하이퍼 파라미터 최적화는 기존 딥러닝 소프트웨어(Caffe, Torch, Theano )를 사용하여 수작업으로 실시되며, 표준 소프트웨어를 개조하여 신경망 각 층의 종류와 순서, 네트워크 층수 등 신경망의 토폴로지(망 구성)를 결정하게 됨



Ø 그 다음으로는 생성된 신경망을 교육하고 그 성능을 검증하는데, 이 과정을 여러 번 반복하여 최적의 신경망의 형태를 얻게 되며, 이 과정은 연구자가 경험과 감에 전적으로 의존하여 진행되기 때문에 통상 새로운 신경망을 생성하는 데 몇 달씩 소요되기도 함


Ø 그런데 오크 릿지 연구소는 이 튜닝 작업을 AI로 설계하고 이를 수퍼 컴퓨터로 실행함으로써 큰 ​​성과를 올렸는데, 즉 특정 연구에 최적화 된 신경망을 연구자의 수작업이 아니라 AI로 생성시킨 것


Ø 이 방식을 통해 오크 릿지 연구소는 과학연구 전용 신경망을 단 몇 시간 만에 생성하는 데 성공했으며, 이렇게 AI가 만든 신경망이 현재 중성미립자(Neutrino) 연구에 크게 기여하고 있다고 함


ž 오크 릿지 연구소가 신경망 생성에 이용한 AI MENNDL(Multinode Evolutionary Neural Networks for Deep Learning)이라 부르는데, 생물이 진화하는 방식을 모방한 것이라고 함


Ø 사람이 HPO를 하는 것과 마찬가지로, MENNDL 우선 특정 데이터 세트, 가령 중성미립자 실험 데이터의 처리에 특화된 신경망을 생성한 다음 신경망을 교육시키고 그 성능을 평가하며, 그 평가 결과에 따라 신경망 구조를 변화시킴으로써 성능 향상을 도모함


Ø 이 과정을 반복하여 고급 신경망을 생성하게 되는데, 이 기법은 생물의 DNA가 배합과 변이를 반복하며 진화하는 방식을 모방하고 있기 때문에 진화적 알고리즘(Evolutionary Algorithm)이라 불림


<자료> Oak Ridge National Laboratory


[그림 3] MENNDL의 진화적 알고리즘


Ø MENNDL은 생성된 신경망의 교육과 성능 평가를 타이탄 수퍼 컴퓨터의 노드를 이용해 수행하는데, 마스터(master) 노드에서 진화의 프로세스를 실행해 신경망을 생성하면, 워커(worker) 노드는 생성된 네트워크를 교육하고 그 성능을 평가하게 됨


Ø 딥러닝 알고리즘을 포함하고 있는 수정 가능한 소프트웨어 프레임워크로는 카페(caffe) 를 사용하여 워커 노드에서 대규모 병렬 실행을 하며, 마스터 노드와 워커 노드 사이의 통신은 Message Passing Interface라는 프로토콜을 사용하고 있음


ž MENNDL을 활용하고 있는 것은 오크 릿지 연구소뿐 만이 아니며, 현재 여러 연구기관에서 의료 연구나 우주 탄생 연구 등에 적합한 신경망 생성에 활용하고 있음


Ø 소아암 연구로 유명한 세인트 주드 소아 병원(St. Jude Children 's Research Hospital)MENNDL을 이용해 생성한 신경망을 의료 연구에 사용하고 있는데, 3D 전자 현미경으로 촬영한 이미지에서 미토콘드리아를 식별하는 신경망을 생성하였음


Ø 미토콘드리아는 발견할 수 있기는 하지만 존재하는 위치가 다양하며 모양과 크기가 달라 사람이 식별하기는 어렵기 때문에, 세인트 주드 병원은 MENNDL을 이용해 미토콘드리아를 식별하기 위한 의료 전용 신경망을 생성한 것임


Ø 페르미 국립 가속기 연구소(Fermi National Accelerator Laboratory) 역시 MENNDL을 이용해 중성미립자 검출을 위한 전용 신경망을 생성하였음


<자료> Fermi National Accelerator Laboratory


[그림 4] 페르미 연구소의 뉴트리노 관측기기


Ø 중성미립자는 입자 중에서 페르미온(Fermion)으로 분류되면 질량은 매우 작고 다른 입자와 상호 작용이 거의 없으며 투과성이 높아서 감지해 내기가 매우 어려움


Ø 중성미립자 연구는 초기 우주의 규명과 물질 구조의 규명으로 이어질 것으로 기대되어 각국에서 경쟁적으로 연구가 진행되고 있는 분야임


Ø 페르미 연구소는 관측 장치를 개발해 중성미립자를 대량으로 생성한 후 그 상호작용을 연구하고 있는데, 중성미립자 검출에 특화된 구조를 가진 신경망을 이용하고 있음


Ø 신경망은 관측 사진을 분석해 중성미립자가 장치 내 어디에서 상호작용을 일으킨 것인지를 정확히 파악하는데, 사진에는 다른 입자들이 일으킨 상호작용도 무수히 기록되기 때문에 일반적인 신경망을 통해 중성미립자를 골라 내는 것은 매우 어려운 일이었음


Ø 그러나 MENNDL을 통해 전용 신경망을 만들 수 있게 됨에 따라, 아주 드물게 발생하는 중성미립자의 상호 작용을 정밀하게 식별할 수 있게 된 것임


Ø 페르미 연구소에서는 MENNDL 50만 종류의 신경망을 생성하고 이를 교육한 후 성능을 평가했는데, 교육 데이터로 중성미립자의 상호작용을 기록한 이미지 80만 장을 사용했으며, 평가를 통해 가장 판정이 정확한 신경망을 선정해 연구에 활용하고 있음


Ø 이러한 일련의 과정은 오크 릿지 연구소의 경우와 마찬가지로 타이탄의 18,688개 노드에서 병렬로 실행되었는데, 과학 전용 신경망의 개발과 이를 이용한 과학 연구는 AI 수퍼 컴퓨터의 도입으로 비로소 가능해졌다고도 볼 수 있음


ž 한편 특정 용도의 신경망을 AI로 생성하는 것이 수퍼 컴퓨터 이용이 가능한 대형 연구소에서만 가능한 것은 아니며 일반 기업도 가능해졌는데 여기에는 구글이 기여한 바가 큼


Ø 구글은 이미 AI를 이용해 고급 기계학습 알고리즘을 생성하는 오토(Auto)ML 기술을 사내 에서 자체적으로 이용하고 있었는데, 최근 이 기술을 클라우드 오토ML이라는 클라우드 서비스 형태로 공개하였음


Ø 오크 릿지 연구소의 전용 AI 개발은 세계 최고급의 수퍼 컴퓨터가 있기에 가능한 측면이 있었고, 그러한 고도의 컴퓨팅 자원을 보통의 기업이 갖추기는 현실적으로 어려운 것인데, 구글이 클라우드 오토ML을 공개함에 따라 전용 AI 개발에 대한 접근성이 높아진 것임


Ø 구글이 오토ML을 개발하고 또 공개한 이유는 오크 릿지 연구소의 경우와 동일한데, 일반 AI가 다양한 기능이 있기는 하지만 고급 판정 능력이 필요한 특정 업무에는 사용할 수 없어 전용 AI를 개발해야 하며, 이 작업을 할 수 있는 AI 연구자는 극소수이기 때문


Ø 아마존이나 마이크로소프트와 마찬가지로도 이미 구글은 클라우드 ML 엔진이라는 서비스를 통해 일반 AI를 클라우드로 제공하고 있었으며, 이 서비스를 이용하는 기업들은 구글이 제공하는 클라우드 비전 API를 통해 이미지 인식 처리를 실행할 수 있음


Ø 클라우드 비전 API를 이용하며 쉽게 사진을 분류할 수 있는데, 가령 하늘의 구름 사진을 입력하면 시스템은 skycloud라고 정확히 분석 결과를 보여주며, 인물 사진을 입력하면 사람의 얼굴 형태임을 인지하고 그 표정을 분류하는 기능도 제공하고 있음


Ø 그러나 기상 전문가들에게는 이러한 클라우드 비전 API를 이용한 이미지 판정 기능이 충분하지 않은데, skycloud 정도만을 판정하는 기능으로는 권운(cirrus), 권적운(Cumulus humilis) 등과 같이 구름의 종류를 판정할 수 없기 때문


<자료> Gigazine


[그림 5] 기상 전용 AI의 구름 유형 식별


Ø 따라서 구름의 종류를 판별 할 수 있는 기계학습 알고리즘을 개발하는 것이 요구되지만, 이 작업을 할 수 있는 연구자의 수는 많지 않으며 개발 작업에도 많은 기간이 소요되는 문제점이 있었으며, 이러한 수요에 부응해 구글이 내놓은 것이 클라우드 오토ML


Ø 클라우드 오토ML을 이용하면 AI가 연구자 대신 전용 AI를 짧은 시간 안에 개발해 주기 때문에, 기상 전문가들은 구름의 종류를 판정 할 수 있는 기계학습 알고리즘을 클라우드 오토ML을 이용해 자동으로 생성할 수 있음


ž 구글에 따르면 클라우드 오토ML로 생성한 알고리즘의 인식률은 일반적인 신경망보다 정확도가 높아 활용가치가 더 높으며, 이미 다양한 분야에서 성공 사례가 나오고 있음


Ø 오토ML을 이용하면 우선 신경망 개발 기간을 크게 단축 할 수 있는 것이 장점으로, 파일럿 모델이라면 몇 분 안에 가능하고 프로덕션 모델이라도 하루 정도면 개발이 가능한데, 이렇게 금세 만든 신경망이라도 인식률은 기존 일반 AI보다 높다고 함


Ø 구글은 클라우드 오토ML을 비즈니스에 응용한 사례도 공개하고 있는데, 패션 브랜드인 어번 아웃피터(Urban Outfitters)는 상품에 태그를 붙이는 과정을 클라우드 오토ML 서비스를 이용해 자동화하고 있음



Ø 어번 아웃피터는 상품에 부여된 태그를 키 값으로 사용해 소비자들에게 제품을 추천하고 있으며, 상품 검색과 제품 필터링에서도 태그가 사용하는데, 이 태깅 작업에 클라우드 오토ML 을 이용해 상품 이미지를 분석하고 제품의 특징량을 추출하고 있음


Ø 가령 옷을 분류할 때 클라우드 오토ML로 만든 알고리즘은 가슴 부위의 형태에 따라 상품을 V-, 스쿱(Scoop) , 크루(Crew) 등으로 판정하는데, 이는 알고리즘이 디자인 패턴과 목선 등을 키 값으로 태그를 생성할 수 있기 때문


<자료> Google Cloud Platform

[그림 6] 어번 아웃피터의 패션 전용 AI


Ø 동물의 생태를 보호하는 활동을 전개하고 있는 국제 환경보호단체 Zoological Society of London(ZSL) 역시 클라우드 오토ML을 적극 활용하고 있음


Ø 이 단체는 동물의 생태를 이해하기 위해 서식지에 카메라를 설치하고 동물의 행동을 관찰하고 있는데, 범용 알고리즘이 사진을 보고 동물의 종류를 정확히 판정할 수 없기 때문에 사람이 이 과정에 관여하다 보니 태기 작업에 통상 9개월이 소요되었음


Ø 9개월이 지나고 나면 이미 야생동물의 이동이 크게 이루어지고 난 다음이기 때문에 보호 전략을 세워봐야 무용지물인 경우가 많았고, 밀렵꾼에 대한 대응도 뒷북이기 일쑤였는데, ZSL은 이 과정을 클라우드 오토ML을 이용해 자동화함으로써 문제를 해결하였음


Ø 9개월이 걸리던 태깅 작업을 순식간에, 또한 정확하게 처리할 수 있게 됨에 따라 ZSL은은 효과적인 동물보호 활동을 되었으며, 운영 비용 또한 크게 낮출 수 있게 되었는데, 단체 내에 AI 전문가 없이도 클라우드 오토ML 이용을 통해 이 모든 것이 가능하게 된 것임



ž AI를 만드는 AI의 이용 접근성이 높아짐에 따라 올해는 특정 업무 전용의 고급 AI 개발이 급증할 것으로 예상되며, AI의 개발의 대중화로 획기적인 AI가 출현할 가능성이 높음


Ø 에릭 레이먼드는 1997성당과 시장이란 글을 통해 중세시대 소수 성직자들이 지식을 독점한 것처럼 소수의 프로그래머들 소스코드를 독점해 프로그램을 개발하는 데서 벗어나 시장처럼 여러 사람이 모여 오픈소스로 공동 개발하는 것이 더 우월함을 주장한 바 있음


<자료> Network World

[그림 7] AI의 민주화


Ø 구글은 클라우드 오토ML 서비스를 공개하며 AI의 민주화를 기치로 내걸었는데, 여기에는 누구나 고도의 AI를 용이하게 개발할 수 있는 환경을 제공함으로써 소수가 개발할 때보다 훨씬 획기적인 AI가 개발되는 환경을 조성하겠다는 의미가 내포되어 있음


Ø 물론 구글의 클라우드 오토ML 서비스는 이제 막 시작된 것이고, 현재는 이미지 인식(Convolutional Neural Network) 관련 AI만 개발할 수 있는 한계가 있어 클라우드 오토ML을 통해 만든 신경망이 필요한 수준의 기능을 제공해주지 못할 수 있음


Ø 그러나 향후에는 음성 인식(Recurrent Neural Network) 관련 AI를 개발할 수 있는 기능도 제공될 것으로 예상되며, AI를 개발하는 AI의 기술이 발전할수록 클라우드 오토ML로 생성하는 신경망은 보다 고도화되며 동시에 보다 만들기 쉬워질 것임


Ø 그 시점이 도래한다면 AI의 민주화라는 구글의 비전이 현실화될 수 있을 것이며, 현재의 모바일 앱 개발처럼 수 많은 사람이 AI의 개발과 교육에 직접 참여하고 협업하는 과정에서 AI는 질적 도약을 이뤄낼 수 있을 것임


Ø 누구나 자신에게 필요한 AI를 누구나 개발할 수 있는 환경이 도래함에 따라 올해는 업무에 특화된 AI 알고리즘 개발이 확산될 것으로 예상되며, 더 나은 AI가 개발되고 확산되는 과정을 통해 인공지능은 우리 삶에 보다 급격히 접목되어 나갈 수 있을 것임