Search

'Segmented Regression'에 해당되는 글 1건

  1. 2018.07.12 구글 액션 카메라 ‘클립스’, 사진작가 기술 습득한 AI가 자동 촬영

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1854호(2018. 7. 11. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

구글 액션 카메라 ‘클립스’, 사진작가 기술 습득한 AI가 자동 촬영.pdf



구글이 판매 중인 구글 클립스(Google Clips)’ 제품은 AI(인공지능)가 탑재되어 있어 자동으로 비디오를 촬영해 주는 액션 카메라임


구글 클립스에 탑재된 알고리즘은 그림이 된다 싶은 장면을 인식하여 자동으로 셔터를 누르는데, 실제 사용해 본 사람들은 클립스가 기기 자신만의 기호를 가지고 있는 듯 하며 사람과 애완동물이 즐거워하는 장면을 비디오로 담는다는 평을 내놓고 있음


딥러닝이 진화하며 알고리즘이 개체의 종류를 정확하게 파악할 수 있게 되면서 이 기술을 응용하여 AI가 인간을 대신해 사진을 촬영하는 기술이 새로운 개발 주제가 되고 있는데, 구글 클립스는 이런 흐름을 정확히 반영한 제품임


클립스는 단일한 솔루션으로 카메라가 셔터 찬스를 자동으로 인식하여 전문 사진작가처럼 비디오를 촬영하게 하는 것을 목표로 설계되었음


클립스는 가족이나 애완동물 등의 촬영을 주로 가정하여 디자인되었으며, 따라서 인텔리전트 기능을 통해 AI가 사람과 애완동물을 정확히 식별함


클립스에 가족 구성원들을 가르쳐두면 그 인물을 중심으로 촬영을 하며, 알고리즘은 미소 혹은 춤과 포옹 같은 움직임을 셔터 찬스로 파악해 비디오 촬영을 시작함



클립스는 웹캠과 유사한 디자인을 띤 소형 카메라이며, 별도의 뷰파인더 없이 스마트폰 앱으로 비디오를 확인하고 카메라의 위치도 조정함


<자료> The Verge

[그림 1] AI 액션 카메라구글 클립스


카메라 렌즈 부분을 오른쪽으로 돌리면 촬영이 시작되는데, 촬영 중에는 흰색 표시등이 깜박거리며 촬영 중임을 표시해 줌


클립스는 최고의 씬을 선택해 6초짜리 짧은 비디오 클립을 수록하게 되며, 렌즈 아래의 버튼을 누르면 수동으로 촬영할 수도 있음


클립스는 130도 광각 렌즈를 탑재하고 있어 피사체에 가까이 놓고 사용할 필요가 있는데, 피사체와 거리가 3~8피트(0.9~2.4 미터)가 적합하다고 함


클립스에는 뷰파인더가 없어 스마트폰 앱 구글 클립스로 카메라에 잡힌 영상을 확인하게 되며, 카메라의 위치도 앱으로 확인해 수평상태로 되어 있는지 등을 체크


<자료> Google

[그림 2] 스마트폰 앱을 통한 비디오 확인


촬영한 동영상은 클립의 스토리지(16GB)에 저장되며, 이 비디오가 클립에서 앱으로 전송되어 스마트폰으로 볼 수 있는 것임


비디오에서 저장(Save) 옵션을 선택하면 사진 저장 클라우드인 구글 포토(Google Photos)에 업로드 되며, 비디오는 사진 또는 비디오 클립으로 저장할 수 있고, 개인정보보호 차원에서 촬영한 비디오는 저장 기능을 사용하지 않는 한 장치에서만 보관됨


사람을 대신해 촬영을 하는 클립스의 AI는 자연스러운 장면을 포착해 촬영하도록 교육된 것으로 보이며, 구도, 색채, 조명 등은 그다지 고려하지 않는 것으로 보임


클립스는 사람 대신 AI가 인상적인 장면을 자동으로 촬영하기 때문에 스마트폰을 가지고 피사체를 추적해야 할 필요가 없음


식사 중이라면 클립스를 테이블에 놓아두는 것만으로 그림이 되는 장면을 촬영할 수 있고, 수영장에서 놀고 있는 아이를 촬영하고 싶으면 클립스를 아이쪽으로 향해 두는 것만으로 즐거워하는 장면을 촬영할 수 있음


파인더로 보며 셔터 찬스를 얻기 위해 쫓아다녀야 할 일을 AI가 대행해 주기 때문에 클립스 사용이 늘어난다면 향후 비디오 촬영 스타일은 근본적으로 바뀔 수 있음


클립스는 그림이 된다 싶은 장면을 포착할 때 두드러진 판정 기준을 가지고 있는데, 사람이 어떤 행동을 취하는 것에 민감하게 반응하여 셔터를 누르는 것으로 보임


가령 뛰어 오르거나 춤을 추는 장면 등을 촬영 기회라고 이해하며, 또한 엄마와 아기가 물에 손을 넣고 물보라를 일으키며 놀고 있는 장면 등은 놓치지 않는데, 특히 즐거운 듯이 웃고 있는 장면은 반드시 촬영을 함


반면, 구도, 색채, 조명에 대해서는 고려하지 않는 것으로 보이는데, 이는 클립스에 내장된 AI가 사람이나 애완동물의 자연스러운 장면을 촬영하도록 교육되어 있음을 시사


<자료> PetaPixel

[그림 3] 미소포옹키스 등을 주로 포착


구글은 클립스의 AI를 교육하기 위해 전문 사진작가의 사진 기술 노하우를 알고리즘 교육을 위한 데이터로 생성했다고 함


알고리즘에 최적의 장면이 무엇인지 학습시키기 위해 구글은 먼저 교육 데이터를 생성했는데, 이를 위해 비디오에서 많은 세그먼트를 추출하여 장면들의 쌍을 만들고, 전문 사진작가들에게 각각의 쌍을 비교해 어느 쪽이 그림이 되는 지를 선택하게 하였음


이런 취사선택을 교육 자료로 만들어 알고리즘 교육에 사용했는데, 신경망(MobileNet Image Content Model)이 장면 속의 객체를 판정하게 하고, 기계학습 기법(Segmented Regression)을 통해 어느 장면이 그림이 되는지 판정하게 하였음


이 과정을 반복하며 클립스의 알고리즘은 전문 사진작가의 기법을 학습하게 된 것임


<자료> Google

[그림 4] 클립스 탑재 AI의 알고리즘 교육과정


실제 사용해본 사람들은 클립스가 가족들이 즐거워하는 얼굴 표정이나 몸 동작을 확실하게 파악해 일상생활의 한 단면을 인상적인 비디오로 생성해준다는 평을 내놓고 있음


클립스가 잡은 화면은 생동감 있는 장면이 많은 것이 특징으로, 전문가의 기법을 전수받았기 때문인지 아마추어들의 사진보다 테크닉이 낫다는 것이 대체적인 평이며, 사람은 클립스가 촬영한 동영상 중에서 마음에 드는 장면을 고르기만 하면 됨


구글 클립스는 아직 한계가 많지만 사진 촬영의 주도권이 사람에서 AI로 전환되는 방향으로 나아가고 있음을 알려주는 전령사로 향후 기술 발전 속도에 관심이 모이고 있음


클립스의 AI는 교육 내용에 종속적이기 때문에 지금은 가족으로 등록된 사람이나 애완동물의 움직임에만 반응하며 다른 개체를 자동으로 촬영 할 수는 없음


사람들이 주로 사진이나 비디오를 찍는 이유가 되는 관광 명소나 멋진 옷을 촬영하도록 교육시키지 않았기 때문에 알고리즘은 이러한 피사체를 촬영 대상으로 인식하지 못함


이런 제한성 때문인지, 올해 2월부터 판매되기 시작한 클립스의 판매실적은 정확히 발표되고 있지 않지만, 5월부터 판매가격을 기존 249 달러에서 199 달러로 내린 데서 소비자들의 대중적 반응은 아직 없는 것으로 추정되고 있음


그러나 지금 당장 사진 촬영의 주체가 사람에서 AI로 넘어가는 것은 아니더라도, 클립스는 사람의 기술이 AI로 대체되는 방향으로 진행되고 있음을 보여주는 또 하나의 사례가 될 것이라는 게 대체적인 전망임


<자료> Google

[그림 5] 사람 대신 촬영해 주는 AI 카메라


알고리즘 교육 데이터가 늘어나면 클립스가 찍을 수 있는 대상은 언제든 확대가 가능하므로, 인스타그램에서 주목받는 인기 사진과 비디오를 사람이 아닌 AI가 촬영하는 시대가 이미 목전에 와 있다는 것임