※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1851호(2018. 6. 20. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

AI로 강화된 이미지 검색 기능 ‘구글 렌즈’의 가능성과 과제.pdf



[ 요 약 ]


구글이 인공지능(AI) 기술을 접목해 이미지 인식 기능이 한층 강화된 구글 렌즈(Goolge Lens)'의 새로운 버전을 발표하였음. 구글 렌즈는 구글이 지난 2010년에 공개했으나 성공하지 못했던 고글 서비스의 업그레이드 버전으로 이미지 검색을 내비게이션, 주소록 관리, 온라인 쇼핑 등으로 곧 바로 연결시킬 수 있음. 구글 렌즈는 현단계 컴퓨터 비전의 최고 수준을 보여주고 있지만, 스마트폰의 제한된 자원으로 AI 분석을 수행하기 때문에 연속 사용시간이 20여분에 불과해 일상적인 이용 서비스가 되기엔 다소 시간이 소요될 전망



[ 본 문 ]

201711월에 구글 렌즈(Google Lens)’를 선보였던 구글이 6개월 만에 기능을 대폭 강화시킨 최신 버전을 내놓았음


구글 렌즈는 기본적으로 증강현실(Augmented Reality) 기능이며, 카메라가 포착한 개체에 정보를 추가하는 구조임


구글 렌즈는 구글의 자체 제작 스마트폰인 픽셀(Pixel) 2’ 등에 탑재되어 있는데, 인공지능 가상비서인 구글 어시스턴트(Google Assistant)’와 연계해 작동하므로, 구글 렌즈를 시작하려면 구글 어시스턴트 화면에서 렌즈 아이콘을 터치하면 됨


구글 렌즈는 앱의 형태로도 제공되기 때문에 플레이스토어에서 다운로드 받아 사용할 수도 있으나, AI 전용 프로세서 등 하드웨어 종속적 측면이 있어 기능을 온전히 이용할 수 있는 스마트폰 기종은 픽셀2, LG G7, 소니 엑스페리아 XZ2 등으로 한정됨


이번에 발표된 구글 렌즈 최신 버전에서는 이미지 검색 기능이 큰 주목을 받고 있는데, 이미지 검색 기술 자체는 새로운 것이 아니나, 고급 AI 기술이 접목되면서 이미지 검색 기능의 정확도가 크게 향상된 것이 특징


이미지 검색 기능은 기술 수준이 향상될수록 활용 분야가 넓어지고 활용 가치도 커지기 때문에 구글 렌즈 최신 버전의 성능에 많은 관심이 모이고 있음


구글 렌즈는 우선 인식 대상이 텍스트임을 알고 이를 문자로 변환할 수 있는데, 그 의미를 이해하기 때문에 연관된 기능을 스스로 하거나 사용자에게 제안할 수 있음


가령 명함을 카메라로 읽으면 그대로 주소록에 등록할 수 있고, 명함에 기재되어 있는 전화번호를 인식하여 곧바로 전화를 걸 수도 있으며, 주소를 인식하면 구글 지도(Google Maps)를 호출하여 해당 위치까지 경로를 탐색할 수 있음


또한 길을 가다 보게 된 포스터에 관심이 있는 가수의 콘서트 안내 내용이 있다면 구글 렌즈를 통해 콘서트의 공연 프로그램과 연락처 정보를 추출할 수도 있음


구글 렌즈는 소위 OCR(광학문자인식)로서 기능하는 것이지만 그 내용의 의미까지 이해하기 때문에 활용가치가 보다 커지는 것임



<자료> Gadget Hacks

[그림 1] 구글 렌즈로 명함과 포스터 인식


구글 렌즈의 이미지 인식 수준은 회화나 조각 등 예술작품을 식별할 수 있을 정도로 높기 때문에 고도의 전문성을 요하는 서비스에도 활용이 가능함


미술관에서는 오디오 가이드를 빌리거나 도슨트의 설명 시간을 기다리는 대신 구글 렌즈에 가이드 역할을 맡길 수 있는데, 구글 렌즈로 그림을 보면 작품의 제목과 개략적 설명이 나타나고, 표시된 링크를 따라 가면 작품 내용에 대한 설명을 읽을 수 있음


예를 들어 인상파 화가 폴 세잔의 그림 샤토 누아(Château-Noir)’나 조각가 오귀스트 로댕의 청동 조작 작품 칼레의 시민(Les Bourgeois de Calais)’을 정확히 인식하고 소개와 연관 정보를 제시해 줌


미술관에서 촬영한 사진을 나중에 구글 렌즈로 볼 때도 비슷한 개요 설명이 표시되는데, 구글 렌즈의 그림에 대한 인식 수준은 아주 높다는 평을 받을 받고 있어, 앞으로 사람들의 미술 감상 스타일이 바뀔 수 있다는 전망도 나오고 있음


<자료> the Verge

[그림 2] 회화와 조각 미술품을 정확히 인식


미술관 도슨트의 역할 대행과 마찬가지로 구글 렌즈는 관광 가이드 역할도 대신할 수 있는데, 랜드마크가 되는 주요 건물과 기념물, 조형물을 인식할 수 있기 때문


주변의 건물 등에 카메라를 비추면 구글 렌즈는 해당 건물을 인식해 그 이름을 표시해 주며 링크 정보를 함께 제공하는데, 가령 구글 본사를 카메라로 찍으면 구글플렉스(Googleplex)’라는 건물명을 정확히 보여 줌


주요 건물을 촬영한 사진을 나중에 구글 렌즈에서 보면 관광했던 장소의 이름과 간략한 소개글을 보여 줌


<자료> the Verge

[그림 3] 유명 랜드마크 건물의 인식


곳곳에 수없이 존재하는 랜드마크를 인식하는 것은 생각보다 고도의 기술을 필요로 하는데, 특히 보는 각도와 그림자의 방향이 다르기 때문에 랜드마크 이미지를 정확히 판정하는 것은 미술품의 판정보다 매우 어려움


현재 구글 렌즈가 정확히 인식할 수 있는 랜드마크의 수는 한정되어 있고 인식 정확도도 완전하지 않아 향후 더욱 기술 개선이 필요한 상황이라고 함


구글 렌즈를 식물도감으로 활용하는 것도 가능해졌는데, 단 화초에 대한 인식 능력의 제법 괜찮은 편이지만 나무와 잎모양에 대한 판정 능력은 아직 크게 떨어지는 편임


카메라로 집 주변이나 유원지에서 찍은 화초 산진을 보면 구글 렌즈는 자스민(Jasmine)’이라거나 하나비시소우(California Poppy)’라는 식으로 알려주기 때문에 휴대형 식물도감으로 사용하는 것도 가능함


식물은 비슷비슷해 보이는 것들이 많기 때문에 판정이 어렵고, 아주 고도의 학습된 신경망이 필요하지만 구글 렌즈로 꽃을 비추면 반응 속도가 빠르며 정답률도 나쁜 편이 아님


반면, 나무나 나뭇잎에 대해서는 알고리즘 교육이 아직 충분치 않은 것인지 인식 능력이 크게 떨어진다는 평을 받고 있음


전반적으로 비록 제한 사항은 있지만 구글 렌즈로 주변 식물의 종류를 일부나마 알 수 있게 된 것은 그 자체로 컴퓨터 비전 기술의 진화를 잘 보여주는 사례라는 반응이 주를 이루고 있음


이처럼 AI와 결합으로 한층 진화된 구글 렌즈의 이마지 인식 성능을 응용하여 구글은 새롭게 스마트 텍스트 선택기능과 스타일 매치기능을 추가하였음


스마트 텍스트 선택(Smart Text Selection)’ 기능은 구글 렌즈로 인식한 텍스트 중에서 특정 부분을 선택하는 기능인데, 가령 레스토랑 메뉴 중에서 무엇인지 잘 몰라 궁금한 요리를 선택하면 구글 렌즈가 그 내용을 설명해 주게 됨프랑스어나 이탈리아어 등으로 적혀 있을 경우에는 선택 후 번역(Translate)’ 버튼을 터치하면 되는데, 요리의 종류가 무엇이고 주요 사용 재료가 무엇인지를 설명해 줌

<자료> Android Authority

[그림 4] 구글 렌즈의 스마트 텍스트 선택


스타일 매치(Style Match)’는 패션과 가구 등을 제안하는 기능인데, 구글 렌즈로 세련된 옷의 사진을 보면 그 옷과 동일하거나 유사한 디자인의 의류 상품을 제시해 주는데, 제시된 상품이 마음에 든다면 곧 바로 구매할 수도 있음


비단 의류만 그런 것은 아니고 신발이나 가방을 보면, 같은 취향의 상품을 표시해 주고 집안에서 구글 렌즈로 가구를 비추어도 유사한 가구 제품을 보여 줌


이미지로 유사 상품을 제안하는 기능은 아마존 등 쇼핑몰에서도 제공하고 있지만, 구글 렌즈는 카메라에서 포착한 라이브 이미지를 실시간으로 영상 분석한 다음 디자인이 비슷한 상품을 검색해 제시하기 때문에 보다 고도의 기술이 필요한 것임



<자료> Digital Trends

[그림 5] 구글 렌즈의 스타일 매치


◾ 구글 렌즈의 새로운 기능을 뒷받침하는 엣지 컴퓨팅 기반 실시간 분석은 현단계 최고 수준의 컴퓨터 비전 기술을 보여주나 배터리 과소모 등 해결해야 할 난제도 남아 있음


기술적 측면에서 구글 렌즈의 가장 큰 기능적 특징은 실시간 결과(Real-Time Results)’라 할 수 있는데, 말 그대로 실시간으로 객체를 파악할 수 있게 해 줌


구글 렌즈가 탑재된 카메라로 주위를 둘러보면 렌즈에 찍힌 객체 주변에 흰 점이 나타나는 것을 볼 수 있는데, 이 점들은 AI로 분석한 영역을 나타내는 것이며 실시간으로 파악한 후 관련된 정보를 표시해 주는 것임, 구글 렌즈는 시스템 아키텍처 상의 맨 끝(엣지, edge)에 위치한 스마트폰에서 AI로 이미지 분석을 수행하고 메타 정보를 클라우드로 전송하여 백엔드에서 검색 프로세스를 실행하는 구조임


<자료> Digital Trends

[그림 6] 구글 렌즈의 실시간 이미지 분석


이미지 분석에서 엣지 컴퓨팅을 사용한 것은 놀라운 일인데, 스마트폰의 제한된 컴퓨팅 자원으로 신경망을 가동시켜 이미지 분석을 수행해야 하는데다가, 빛의 조건이나 촬영 각도에 따라 이미지가 크게 바뀌기 때문에 개체 인식이 어렵기 때문임


구글은 엣지 컴퓨팅을 위해 클라이언트에는 구글이 자체 개발한 이미지 처리 전용 AI 프로세서인 픽셀 비주얼 코어(Pixel Visual Core)’ 탑재를 권장사항으로 하고 있고, 클라우드 상의 AI 처리에는 클라우드 TPU(Cloud TPU)'를 사용하고 있음


구글 렌즈는 클라어언트에서 실시간으로 연속적인 이미지 분석을 수행하는 구조를 갖추고 있어 최고의 컴퓨터 비전이라 할 수 있지만, 단 프로세서에 높은 부하가 발생해 스마트폰의 발열이 심하고 20분 정도 계속하게 되면 배터리가 바닥나는 문제가 있음


구글에 따르면픽셀 비주얼 코어칩이 표준 프로세서보다 속도가 5배 빠르고 전력 소비량은 10분의 1에 불과한데, 그럼에도 불구하고 구글 렌즈의 연속 사용시간이 20분에 불과하다는 것임


바꿔 말해 픽셀 비주얼 코어를 탑재하지 않은 스마트폰이라면 배터리 소모가 더욱 심할 것이기 때문에, 비판적으로 본다면 구글 렌즈는 아직까지는 컨셉에 가깝고 실제 일상적인 스마트폰 기능으로 사용하기엔 아직 요원하다 말할 수도 있음


이는 스마트폰이라는 제한된 컴퓨터 처리 용량과 배터리 용량을 가진 디바이스를 AI 분석의 단말기로 사용하기 때문에 발생하는 것으로 현재로서는 어쩔 수 없는 문제이며, 향후 지속적으로 해결해야 할 과제임


◾ 구글 렌즈는 일종의 증강현실 기반 이미지 검색으로 구글의 핵심 사업인 검색 서비스 강화가 목적으로 보이며, 기술이 안정화된다면 새로운 구글링 도구로 일상에 자리 잡을 전망


구글은 지난 2010년 이미지 검색 스마트폰 앱인 구글 고글(Google Goggles)'을 선보인 바 있지만 폭넓게 확산되지는 못했음


구글 고글은 랜드마크, 도서, 주소록, 예술작품, 장소, 와인, 브랜드 로고 검색을 이미지 검색으로 수행한다는 컨셉으로, 구글 렌즈가 하려는 기능과 사실상 동일함


<자료> Kliker

[그림 7] 구글 고글의 이미지 검색 기능


구글 렌즈는 구글 고글의 후속 사업모델인 셈인데, 고급 AI를 구현하여 검색 정확도가 크게 향상되었기 때문에 구글은 사용 확산은 기대하고 있음


구글 어시스턴트는 단어 검색 질의뿐 아니라 비디오와 이미지 검색 기능 실행을 통해 검색의 폭을 크게 넓히려 하고 있는데, 구글 렌즈는 구글 어시스턴트를 통한 이미지 검색 질의 건수 증가에도 기여할 것으로 보임


이미지 검색의 정확도를 높이고, 그 결과를 전자상거래와 곧 바로 연결한다는 점에서 구글 렌즈는 구글의 핵심 비즈니스에 가장 부합하는 것이라 할 수 있음


사용시간 문제 등 아직은 일상화하기에 부적합한 면이 있지만 구글 렌즈는 다양한 용도로 활용이 가능하기 때문에, 구글링이 일상적 행위로 자리 잡은 것처럼 구글 렌징도 배터리 문제만 해결된다면 이용자들의 일상 속에 녹아들 것으로 전망되고 있음


※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1819호(2017. 10. 25. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

화이트 칼라 업무 생산성 향상 도구 &lsquo;RPA&rsquo;, AI 붐 타고 도입 급증.pdf



[ 요 약 ]


장시간 노동의 억제가 사회적 이슈로 부상하면서또한 저출산 고령화에 따른 노동 인력 감소 문제에 장기적으로 대응할 필요성이 제기되면서 사무 업무의 노동 생산성 향상을 위한 RPA(로보틱 프로세스 자동화도입이 기업의 화두로 떠오르고 있음. RPA는 최근 인공지능(AI) 기술 등과 접목되며 단순 사무업무뿐 아니라 전문 지식에 기반한 고도의 의사결정까지 지원을 목표로 하고 있는데로봇이 그랬던 것처럼 RPA는 사무 현장의 노동 인력 구조에 중대한 변화를 가져올 것으로 예상됨



[ 본 문 ] 


ž 사무직 노동자의 업무를 자동화 해주는 로보틱 프로세스 자동화(Robotic Process Automation, RPA) 도구를 업무처리 방식의 혁신 수단으로 도입하는 기업이 급증하고 있음


<자료> Roboyo


[그림 1] RPA와 기존 업무시스템의 비교


Ø RPA는 사람이 반복적으로 처리하는 업무를 로봇 소프트웨어를 통해 자동화하는 솔루션으로 많은 인력과 시간을 들여야 하는 단순 업무를 획기적으로 줄일 수 있는 시스템임


Ø 로봇이 점차 지능화되고 있기는 하지만 원래 제조 현장에서 로봇의 역할은 단순 반복 업무를 수행하는 것이며, 로봇 같다는 표현은 종종 주어진 일을 지치지 않고 해낸다는 뜻으로 쓰임


Ø RPA에서 로보틱 프로세스란 반복적인 업무 절차라는 뜻에 가까우며, RPA는 실제 물리적인 로봇이나 기계장치가 아니라 소프트웨어를 통해 사무 현장의 반복업무를 자동화하는 것임


Ø 솔루션 벤더들의 주장에 따르면 화이트 칼라의 사무 작업을 RPA로 자동화할 경우 작업 시간을 80% 가량 줄일 수 있다고 하며, 이런 이유로 RPA를 가상 지식 노동자(Digital Employee)로 부를 수 있다고 함


Ø 화이트 칼라의 업무에도 다양한 종류가 있지만 현재 RPA가 주된 대상으로하고 있는 것은 PC로 수행하는 반복적 일상 작업으로, 한 시스템에서 처리한 결과를 다른 시스템으로 입력함으로써 시스템간 연계를 하는 업무가 대표적임


Ø 초기에 RPA는 보험업을 비롯한 금융기관에서 주로 도입이 진행되었는데, 일상적인 대량의 문서 처리 업무가 많아 도입 효과가 좋았기 때문이며, 현재는 금융업 이외에 제조업 등 다양한 산업으로 확산되고 있는 추세임


Ø 시장조사기관 리서치 앤 마켓에 따르면 향후 5년간 RPA 도입이 급증해 2022년 전세계 RPA 시장규모는 50억 달러를 넘어설 것으로 예상됨


ž RPA 자체는 어디까지나 개념일 뿐이며, 기업이 RPA를 도입하려면 RPA 도구가 필요한데, 자체적으로 개발할 수도 있지만 대부분 기업은 벤더들의 RPA 솔루션을 이용하고 있음


Ø RPA 도구의 주요 역할은 대상 업무의 스크립트(Script)실행(Execution)으로 먼저 업무 담당자가 일반적으로 수행하는 PC 작업의 절차를 정의해야 하는데, 이는 RPA 도구에게 지시할 대본(스크립트)을 만드는 과정이라 보면 됨


Ø 스크립트는 가령 웹 브라우저로 특정 사이트에 접속하여 어떤 데이터를 엑셀로 복사하라는 식으로 여러 소프트웨어에 걸치는 것이 보통이며, 스크립트가 완료되면 그 대본에 따라 RPA 도구가 담당자의 작업을 자동으로 실행하게 도고, 스크립트는 필요에 따라 수시 편집도 가능함


Ø 간단히 이해하자면 엑셀 매크로 기능을 여러 소프트웨어에 걸쳐 실행할 수 있다고 생각하면 되고, 시스템 개발에 사용되는 기능 테스트 자동화 도구와 유사하다고 보면 됨


Ø RPA 도구들은 주로 규칙 엔진을 이용하여 스크립트를 자동화 하며 규칙 엔진 외에도 HTML 분석 기술이나 이미지 인식 기술 등도 이용하는데, 요소 기술들이 새롭거나 특이한 것은 아니어서 기존 기술들을 잘 조합하여 저비용으로 고효율을 얻게 해주는 쪽에 가까움


ž 전세계적으로 RPA 도입이 급증하고 있는 이유는 기업의 규모와 업종, 업무 유형을 불문하고 장시간 노동의 억제가 중요한 사화적 이슈로 부상하고 있기 때문임


Ø RPA 도입에 대한 관심은 2015년경부터 유럽의 금융 기관들을 중심으로 높아졌는데, BPO(비즈니스 프로세스 아웃소싱) 사업자들이 위탁 받은 업무를 효율화하기 위해 RPA 도구를 적용하기 시작한 것이 계기가 되었음


Ø 또한 선진국을 중심으로 현재 기업들은 일하는 방식을 바꾸어야 한다는 사회적 압력에 직면하고 있으며 이에 대한 대응이 급선무가 되었는데 그 해결책의 하나로 RPA가 주목 받게 되었음


Ø 우선 일과 노동의 균형(Work-Life Balance)이 강조되며 장시간 노동의 억제가 기업이 외면할 수 없는 주요 사회적 아젠다가 되고 있음


Ø 다른 한편으로 고령화와 저출산에 따른 노동인구 감소와 부족의 문제가 점차 부각되고 있는데, 이는 시간이 흐ㅁ를수록 장기적으로 더욱 악화될 것으로 예상되는 문제이기 때문에 기업들은 생존을 위해서라도 현재와 다른 업무 방식을 고민할 수밖에 없는 상황임


Ø 이런 과제 극복을 위해 주요하게 대두되는 문제가 화이트 칼라의 생산성 향상이기 때문에, 사무 업무의 자동화를 통해 생산성을 향상시켜 주는 RPA의 도입이 적극적으로 검토되고 있음


Ø RPA 소프트웨어는 기업 입장에서 이상적인 노동 자원으로 볼 수 있는데, 로봇이므로 노동시간을 신경 쓸 필요는 없어 야간이든 휴일이든 작업지시를 할 수 있고, 게다가 기계적으로 작업을 확실하게 해내기 때문에 작업 속도와 오류율 면에서 사람보다 나은 성과를 보여주기 때문


Ø 여기에 벤더들의 노력으로 RPA 도구가 더 사용하기 쉽게 된 것도 도입을 가속화하는 요인이 되고 있는데, 인터페이스와 조작 방법이 개선되며 PC 작업을 대체하기 위한 스크립트 작성과 실행이 용이하게 되었음


ž 최근 고조되는 인공지능(AI) 붐도 도입 배경으로 꼽히는데, 벤더들은 RPAAI를 활용한 사무 고도화의 첫 걸음으로 자리매김하며 주목도를 높이고 있음


Ø PC 작업을 자동화하는 RPA는 응용 범위가 넓고, 다른 기술과 제품에 비해 상대적으로 도입하기가 쉽기 때문에, 지금까지 IT화의 대상이 되지 않았던 업무와 IT화를 했을 때 투자 대비 효과가 나오지 않는다고 간주되었던 업무에도 적용할 수 있는 것이 장점임


Ø 투자 대비 효과의 측정이 가능하고 단기간에 투자를 회수할 수 있음이 도입 사례들을 통해 지표로 제시되고 있다는 점도 기업 경영진들의 주목을 끄는 배경이 되고 있음


Ø 또한 최근 AI 붐을 타고 조만간 RPA와 인공지능을 조합한 시스템이 등장할 것이라는 전망이 나오는 것도 RPA 도입 결정에 긍정적인 요인이 되고 있는데, 루틴한 작업뿐만 아니라 중장기적으로 고비용의 전문직 인력이 해오던 고급 의사 결정까지 대행을 맡길 수 있기 때문


Ø 이에 따라 RPA를 도입하려는 기업은 RPA 도구들을 정확히 비교, 평가하고 자신들에게 적합한 도구를 선택하는 것이 매우 중요하게 되었는데, 단순 업무 처리에 그치지 않고 고도의 전문성을 요하는 업무까지 RPA로 처리하게 될 경우 이는 기업의 경쟁력과 직결되는 일이기 때문


ž 기업이 제대로 된 RPA 도구를 선택하려면 사람으로 치면 --에 해당하는 기술 요소들을 잘 이해해야 하는데, 우선 눈에 해당하는 기술 중에는 구조 분석 기술이 가장 중요함


Ø 구조 분석 기술은 RPA 도구가 조작 대상으로 삼는 응용프로그램의 화면들이 어떤 요소로 구성되어 있는지를 해석하는 것으로, 구성 요소에는 메뉴, 입력 영역, 버튼, 선택 항목(라디오 버튼, 드롭다운 리스트) 등이 포함됨


Ø 구조 분석 기술을 사용할 수 있어야 보다 확실하게 조작 대상을 특정 할 수 있게 되는데, 구조를 분석할 수 없는 응용프로그램의 업무를 자동화하려면 작업 대상을 이미지로 인식해야 하고 이럴 경우 작동하는 PC의 해상도 차이 등에 영향을 받기 때문


Ø 어떤 응용프로그램을 구조 분석의 대상으로 할 수 있는지는 RPA 도구에 따라 다르기 때문에 벤더별 차별화 요소가 되며 기업이 벤더의 도구를 선택할 때 중요 포인트가 됨


<자료> UiPath Studio


[그림 2] 웹 페이지 구조 분석 기술


Ø 구조 분석 기술에서는 웹 사이트에서 정보를 추출하기 위해 웹 스크레이프(scrape) 기술을 많이 사용하는데, 이 기술은 가령 웹 페이지로 퍼블리싱 되는 주가 및 부동산 정보 등의 정보를 추출하고 이를 가공·분석하여 보고서를 작성하는 업무를 자동화하는 경우 아주 유용함


Ø RPA 도구가 추출 대상으로 하는 웹 사이트의 정보 중 일부는 표 형식의 데이터로 존재하는 경우도 많은데, 이런 표 형식의 데이터를 그대로 가져오는 구조를 가진 도구들도 있음


Ø RPA 도구의 스크립트 작성은 시나리오 기반으로 이루어지는데, 소프트웨어 로봇의 작업 흐름을 정의한 시나리오 대로 실제 구현이 되게 하기 위해서는 정보의 용이한 취득을 지원하는 구조 분석 기술 요소가 매우 중요함


ž 사람의 눈에 해당하는 기술 요소로 구조 분석 기술을 보완하는 것으로는 이미지 인식 기술과 OCR(광학문자판독) 등이 있음


Ø 이미지의 특징을 분석하여 작업 범위를 특정하는 것이 이미지 인식 기술인데 앞서 말한 것처럼 PC의 해상도를 비롯 RPA의 실행 환경에 따라 작동이 다를 수 있고, 구조 분석 기술에 비해 조작 대상을 특정하는 정확도는 떨어지지만 많은 RPA 도구들이 이미지 인식을 채택하고 있음


Ø RPA 도구가 조작 대상 화면을 이미지로 인식할 수밖에 없는 상황이 있기 때문인데, 가령 원격 데스크톱으로 접속하여 다른 PC의 응용프로그램을 작동시키거나 가상화 기술로 배포된 응용프로그램을 조작하는 등의 경우를 들 수 있는데, 최근에는 이런 방식의 이용 사례가 늘고 있음


Ø OCR 엔진을 포함하고 있는 RPA 도구도 있는데, 원격 데스크톱으로 접속한 화면에서 정보를 검색할 때 이미지 정보를 텍스트화로 변환할 필요가 있는 경우 등에 이용됨


Ø RPA 도구로 정보를 추출해야 할 대상이 종이 장표 밖에 없는 경우는 당연히 OCR이 도움이 필요하며, 정보를 디지털로 변환하여 RPA 도구로 처리할 수 있도록 할 필요성이 클수록 OCR 엔진을 활용하게 될 경우가 늘어날 것임


ž RPA 도구의 기술 요소 중 사람의 뇌에 해당하는 기술은 업무 절차와 규칙에 따라 작업이 진행될 수 있도록 하는 역할을 하며, 워크플로우와 규칙 엔진이 대표적임.


Ø 화이트 칼라의 일상적인 업무는 일반적으로 정해진 절차와 규칙에 입각해 진행되는 경우가 많기 때문에 RPA 도구는 작업자의 일련의 처리 흐름을 설계하고 실행하는 워크플로우(workflow) 기능을 갖추고 있어야 함


Ø 처리 흐름이란 가령 ①수신 메일에서 입력할 데이터를 얻는다 à ②입력 데이터를 확인한다 à 데이터를 시스템에 입력한다 à 처리 결과를 메일로 통보한다 등이 될 수 있음


Ø 여러 사람이 협업해 업무를 수행하는 경우는 RPA 도구에 있는 워크플로우 기능을 사용하는 대신 사내에서 사용 증인 워크플로우 시스템에서 제공하는 승인 절차와 연계하는 방식을 취하는 것이 더 효과적일 수 있음


<자료> Network Automation


[그림 3] SAP와 세일즈포스닷컴 연계를 위한 워크플로우


Ø RPA가 제공하는 규칙 엔진은 처리 대상 상품의 할인율을 바꾼다거나, 신청 유형에 따라 심사 대상을 바꾸는 등 미리 정한 규칙에 따라 작업을 실행할 수 있게 해주는 기술 요소임


Ø 업무 규칙은 다양한 상황 변화에 ​​따라 수시로 변경되는 것이 일반적인데, 규칙 엔진을 사용하면 시스템에 미치는 영향을 최소화하면서 규칙을 추가, 변경할 수 있게 됨


ž RPA의 기술 요소 중 사람 손에 해당하는 것은 주로 응용프로그램에 정보의 입출력을 담당하며, 마우스나 키보드의 모방과 응용프로그램 작업 라이브러리 등이 있음


Ø 대부분의 사무 업무는 데이터의 입력과 작성으로 마무리 되므로, RPA 도구는 사람이 마우스 나 키보드를 사용하여 작업하는 것을 모방하여 그대로 수행할 수 있게 해주는 기술이 필요함


Ø RPA 도구를 윈도 환경에서 실행하는 경우 윈도 API가 제공하는 인터페이스를 활용한 프로그램을 이용하여 마우스와 키보드의 조작을 모방하는 것이 일반적임


Ø 벤더들이 내놓은 RPA 도구 대부분은 자주 사용되는 응용프로그램으로 수행되는 작업에 특화된 라이브러리를 제공하고 있는데, 가령 윈도 환경이라면 엑셀에서 셀 편집, 엑셀의 행과 열 추가 및 삭제, 아웃룩에서 메일 송수신 등의 작업이 라이브러리로 제공됨


ž RPA에 대한 관심이 높아질수록 벤더들은 AI 등을 이용해 기능을 더 고도활 할 것이기 때문에, 도입을 고려 중인 기업은 기능 최적화 및 확장성 등을 면밀히 비교할 필요가 있음


Ø RPA는 기술적 측면에서 새롭거나 혁신적인 요소가 있는 것은 아니고, 이미 부분적으로 기업들이 도입하고 있는 기술 요소들도 있기 때문에, 벤더들로서도 RPA 판매를 위해서라면 차별화 된 가치 제공을 위해 최신 기술 트렌드 접목을 시도할 수밖에 없는 측면이 있음


Ø 따라서 RPA 도구의 기능은 계속 고도화되고 발전할 것인데, 예를 들어 에 해당하는 기능이라면 AI를 활용해 고도의 업무 판단 능력을 장착하려 할 것임은 누구나 쉽게 예상할 수 있는 것이었고, 실제로 이미 벤더들은 AI 기능 장착을 마케팅 포인트로 잡고 있음


Ø AI 기반의 RPA 도구들은 가령 다양한 장표의 포맷을 기계학습 시킨 알고리즘을 담고 있기 때문에, 장표를 입력하면 레이아웃을 자동으로 인식해, 이름, 주소, 회원번호 등의 항목을 자동으로 추출하는 등의 기능을 구현하고 있음


Ø OCR AI를 조합하여 인식률을 향상시킨 AI-OCR 기술의 활용도 시작되고 있기 때문에 RPA 도구와의 연계도 진행될 것으로 예상됨


Ø RPA 도입을 고려중인 기업이라면 자신들에게 가장 필요한 기술 요소가 뛰어난 솔루션이 어느 것인지, 또한 AI 등 향후 기술 고도화나 확장성까지 기대할 수 있는 것이 무엇인지, 기존에 도입한 IT 시스템과 연계가 용이한 것이 무엇인지 다면적으로 검토할 필요가 있음


ž 또한 RPA의 기능이 고도화되고 도입이 확산된다면 생산성 향상의 순기능뿐 아니라 인간 노동력의 재배치 이슈도 발생할 것이므로 섬세한 도입 로드맵 마련이 필요할 것임


Ø IBM에 따르면 기업 업무 중 약 33%를 차지하는 데이터 수집과 처리 영역에 RPA를 우선 도입할 수 있으며, 30%를 차지하는 전문 지식이 필요하고 인력간 상호작용이 필요한 업무에도 고도화된 RPA의 도입이 가능하다고 함


<자료> LinkedIn


[그림 4] RPA의 결과: 생산성 향상 또는 해고


Ø 이는 RPA의 도입에 따라 기업에 미치는 영향이 다층적일 수 있음을 시사하는데, AI 기반의 RPA가 제시하는 고급 의사결정 지원까지 이루어질 경우, 사무 업무의 생산성 향상이라는 당초 RPA 도입 목적 달성을 넘어 기업 인력구조 전반의 거대한 변화로 이어질 수 있음


Ø 제조 현장에서 로봇의 도입에 의해 노동 인력의 구성이 크게 변화한 것처럼, 사무 현장도 RPA라는 로봇 소프트웨어에 의해 노동 인력의 대폭 구조 조정이 가능해질 것이기 때문


Ø 따라서 기업은 RPA의 도입이 AI에 의한 대량 실업의 우려 이슈로 이어지지 않도록 RPA 도입 시 인력전환 및 재교육 계획도 함께 수립해야 할 필요가 있음


Ø 기업의 RPA 도구 도입을 계기로 이제 기업 경영진을 의미하는 C 레벨에 AI 책임자를 두어야 할 필요성, 즉 최고 AI 책임자(CAIO, Chief AI Officer)를 두어야 할 필요성도 고조되고 있음