Search

'silent speech'에 해당되는 글 1건

  1. 2018.05.24 상용화 단계에 다다르고 있는 AI 이용 ‘마인드 리딩’ 기술

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1847호(2018. 5. 23. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

상용화 단계에 다다르고 있는 AI 이용 ‘마인드 리딩’ 기술.pdf



사람의 생각과 마음을 소프트웨어로 읽어 내는 마인드 리딩(Mind Reading)’ 기술은 점차 비즈니스 응용 및 상용화가 가능한 단계에 다다르고 있음


미래 학자들은 오래 전부터 마인드 리딩 기술의 등장을 예측해 왔으며, 실제로 뇌파의 패턴을 검출하는 것은 수십 년 전부터 가능했으나 마인드 리딩까지 가기에는 퍼즐 조각 하나가 부족했는데, 바로 감지한 뇌파를 해석하는 기술임


하지만 인공지능(AI)과 기계학습 기술의 발전에 힘입어 이 퍼즐도 맞춰져 가고 있으며, 마침내 사람의 머릿속에서 일어나는 일들을 알 수 있게 되었음


이 처리 과정을 거칠게 요약하면, 우선 연구진이 개발한 소프트웨어로 인간의 뇌에서 측정한 데이터를 가져와 이를 단어 및 이미지와 매핑시켜 놓고, 이후에 측정한 데이터를 읽고 해석하여 다양한 유형의 생각 표출 및 멘탈 제어 애플리케이션에 사용하는 것임


가령 매사추세츠 공대(MIT) 미디어랩이 고안한 얼굴에 장착하는 장치는 기계학습 시스템과 결합되어 있는데, 사용자가 머릿속으로 생각한 단어를 읽어 내 이를 텍스트로 변환해 주는 기능을 수행함


실시간으로 음성을 텍스트로 전환해 주는 기기들은 이미 많이 사용되고 있지만, MIT가 개발한 기기는 사람이 말하는 과정이 없어도 텍스트 전환이 가능하다는 것이 차이점


사람이 말을 하는 것은 뇌가 얼굴의 근육에 신호를 보냄으로써 가능한 것인데, 연구에 의하면 소리를 내지 않고 마음속으로 무언가 생각을 하게 되는 경우에도 뇌에서 얼굴로 신경 근육 신호가 보내진다고 함


MIT 미디어랩이 개발한 알터에고(AlterEgo)’ 기기는 이 신경근 신호를 전극으로 포착한 후 기계학습 시스템을 이용해 특정 신호를 특정 단어와 매칭함


따라서 이 장치를 이용하면 목소리를 내지 않고 말하기(subvocalization)’ 혹은 침묵의 발성(silent speech)’ 과정을 발성 과정과 동일하게 처리하는 것이 가능해 짐


<자료> MIT Media Labs

[그림 1] 속말을 텍스트로 변환하는 알터에고 프로토타입


연구팀에 따르면 사람마다 얼굴 생김새는 다르지만, 15분 정도만 커스터마이징을 하고 기계학습을 시키면 92%의 정확도를 달성할 수 있었다고 함


이 장치는 골전도 이어폰을 내장하고 있기 때문에, 머릿속으로 가상 비서에게 정보 요청을 한 후 바로 옆에 서 있는 사람도 들을 수 없는, 오직 자신만 들을 수 있는 소리로 보고를 받을 수 있는 애플리케이션의 구현도 가능함


알터에고 기기는 마인드 리딩 기술의 놀라운 사용례라고 할 수 있는데, 뇌가 보내는 모든 신호를 읽는 것이 아니라 안면 근육에 보내는 신호만을 파악해 생각을 읽어냄으로써 속말을 컴퓨터 인터페이스화 할 수 있음을 보여주었다는 데 큰 의의가 있음


또한 이미 보편화 되고 있는 가상 비서와 대화 같은 행위를 다른 사람이 들을 수 없게 수행할 수 있게 함으로써 가상 비서 이용 맥락을 확장했다는 점에서도 의의가 있음


알터에고 외에도 말 또는 소리와 뇌 활동 사이의 연관성을 해석하여 사람과 컴퓨터 사이의 인터페이스 기술로 활용하려는 시도는 여러 대학과 기업을 통해 진행되고 있음


UC 샌프란시스코 대학의 연구팀도 90% 정확도의 마인드 리딩 기기를 개발했는데, 이 장치는 사람이 소리를 들을 때 일어나는 뇌 활동을 감지하는 기술을 기반으로 함


뇌의 활동을 텍스트로 전환해 주는 이 기기의 명칭은 뉴로프로스테시스(neuroprosthesis)’인데, 일종의 간질 치료 방식을 이용한 것으로 피험자의 뇌 표면에 전극을 이식하고 이를 통해 청각 피질의 뇌파를 모니터링 함


외부로부터 감지한 것이든 스스로 만들어낸 것이든 발성은 생각을 텍스트로 변환할 수 있는 장치를 고안하기 위해 필요한 첫 번째 단계가 됨


연구팀은 이렇게 데이터를 얻은 다음 알고리즘을 이용해 특정 단어를 들을 때 뇌파가 어떻게 변하는지를 매핑함으로써 뇌파를 해독하였음


카네기 멜론 대학의 연구팀은 뇌의 스캔을 통해 복잡한 생각을 읽어 내고 이를 적절한 문장으로 변환해주는 방법을 고안했는데, 이들의 연구는 복잡한 사고 과정에서 다음에 올 문장을 AI로 예측할 수 있는 가능성을 보여주었음


페이스북도 마인드 리딩 프로젝트에 착수했는데, ‘빌딩 8(Building 8)’이라는 비공개 조직을 두고 이용자들이 생각만으로 페이스북 메신저에 메시지를 보낼 수 있게 하는 방법을 개발하고 있음


<자료> The Verge

[그림 2] 페이스북의 뇌-컴퓨터 인터페이스(BCI)


유저 인터페이스 개발이 본업인 마이크로소프트도 지난 해 뇌의 행동을 이용해 컴퓨터나 애플리케이션 상태를 변경하는 인터페이스를 개발에 관한 특허를 등록하였음


MS의 연구에 따르면, 가령 음악 재생 시에 소리의 크기에 불쾌감을 느꼈다는 뇌의 활동이 감지되면, 자동적으로 볼륨을 낮추라고 지시하는 것이 가능해 짐


이런 인터페이스 기술은 마우스의 정확도 향상에서부터 복합현실(MR) 기기인 홀로렌즈(HoloLens)’에 이르기까지 마이크로소프트와 관련된 모든 제품에 응용될 수 있음


말이나 소리뿐 아니라 눈에 비치는 시각적 이미지를 이용한 마인드 리딩에 관한 연구 역시 상당한 진전을 이루고 있음


최근 토론토 대학 스카보로 캠퍼스의 연구팀이 공개한 논문은 뇌의 활동에 근거해 피험자에게 보여 준 얼굴의 이미지를 대략적으로나마 재현 가능함을 보여주고 있음


13명의 피험자에게 140명의 얼굴 사진을 보여 주고 그 때마다 나타난 뇌파(EEG) 데이터를 연구팀이 개발한 AI 알고리즘으로 처리한 결과, 희미하지만 식별 가능한 형태로 피험자들에게 보여준 사진의 얼굴을 재현할 수 있었다고 함


연구팀을 조만간 기억 만에서 얼굴을 재현하는 것도 가능할 것으로 확신하고 있는데, 이런 기술은 당연히 경찰 같은 수사기관에 쓰임새가 상당할 것임


교토 대학의 연구팀도 토론토 대학의 연구와 유사한 기능을 가지는 신경망 시스템을 개발하고 있는데, 피험자에게 사진을 보여 주고 기능자기공명단층촬영(fMRI) 장치로 뇌의 혈류 모양을 스캔한 후 AI를 이용해 피험체가 본 이미지를 추정하는 연구임


<자료> Cerebral Cortex

[그림 3] 시각피질 활동 분석을 통한 마인드 리딩


퍼듀 대학 연구팀도 fMRI 장치와 AI를 이용한 마인드 리딩 연구를 진행하고 있는데, 피험자에게 동영상을 보여 주고, AI를 이용해 동영상을 볼 때 시각 피질에서 일어나는 뇌의 활동을 이해하도록 소프트웨어를 학습시켰음


연구팀은 반복 실험을 통해 뇌의 활동 상태만을 보고서 그 사람이 무엇을 보고 있는지를 알아낼 수 있을 것으로 기대하고 있음


보다 실용성을 염두에 둔 맥락에서 마인드 리딩을 연구하는 사례들도 나타나고 있는데, 가상현실(VR) 게임과 자동차 제어에 응용하는 것이 대표적임


스타트업 뉴러블(Neurable)’은 가상현실 게임인 어웨이크닝(Awakening)에서 물건을 집어 올리거나 던지는 작업을 머릿속 생각만으로 할 수 있게 했는데, 전극이 탑재된 머리띠를 HTCVR 헤드셋인 바이브(VIVE)에 연결하여 구현하였음


<자료> gigazine

[그림 4] 바이브 HMD에 전극을 연결한 뉴러블


뉴러블의 게임은 MIT 미디어랩의 연구와 마찬가지로 머릿속의 생각 전체를 읽는 것이 아니라 이용자의 신경 활동을 이용해 명령이나 지시로 사용하는 것임


한편 HTC의 액셀러레이터 프로그램인 ‘VIVE X’에 참가 중인 우리나라의 룩시드 랩스(Looxid Labs)’가 개발 중인 모바일 VR 헤드셋은 시선 추적과 뇌파 측정을 함께 이용하여 감정을 인식하는 기술을 탑재하고 있음


룩시드 랩스는 동일한 기능을 가진 HTC 바이브용 어태치먼트도 개발했는데, 개발자 키트는 올해 여름에 출시할 예정임


보다 실용적인 예로는 올해 3월 제네마 국제 모터쇼에서 닛산 자동차가 공개한 컨셉 카 ‘IMx KURO’를 들 수 있는데 드라이버의 뇌파를 측정하는 헤드셋을 갖추고 있음


이 컨셉 카는 운전자의 뇌파를 이용해 차량의 반응 속도를 향상시키는데, 가령 운전자가 브레이크를 걸려고 하면 뇌파를 감지해 실제 운전자가 브레이크 페달을 밟기 전에 제동을 시작하는 것으로, 닛산에 따르면 차량 반응 속도가 최대 0.5초 빨라진다고 함


◾ 마인드 리딩 AI 기술의 눈부신 발전을 가장 잘 활용하는 길은 독립적인 마인드 컨트롤 애플리케이션의 개발이 아니라 기존 비즈니스 애플리케이션을 향상시키고 보완하는 것임


마인드 리딩 기술의 가치를 극대화하려면 이 기술을 SF 영화에 나오는 초인적 두뇌를 가진 사이보그나 외계인의 능력이 아니라, 우리가 현재 이용 중인 기술들의 정확도와 자율성을 높여주는 아주 현실적인 기술로 바라볼 필요가 있음


예를 들어, 기존의 기술과 마인드 리딩을 결합하면 사용자 본인의 의도와 사고 과정을 이해할 수 있어 자동 수정 및 음성 인식 정확도는 100% 가까이 향상될 수 있음


그때그때의 기분에 따라 조명과 볼륨이 자동으로 조정되도록 하는 것이나 유저 인터페이스가 사용자가 의도한 방식대로 정확히 작동하도록 하는 것도 현실적인 마인드 리딩 기술의 활용 예임


사이버 보안 분야 스타트업인 엠파우(Empow)'는 랜섬웨어 공격을 행하는 해커들의 의도를 정확히 읽음으로써 해커와 전쟁에서 우위를 차지할 수 있게 해주는 마인드 리딩 AI를 개발하고 있는데, 이 역시 매우 현실적인 응용이라 할 수 있음


한편, 중국의 공장, 국영 기업, 군대에서는 대규모로 직원들이나 군인들의 뇌의 활동을 모니터링하고 있는데, 무선 센서를 모자에 장착하고 여기서 얻은 데이터를 A로 분석해 작업장의 전반적인 분위기를 감지하고 있음


이런 방식의 활용은 현실적이기는 하나 빅브라더 논란을 낳기도 하는데, 중국의 기업들은 이 감정 감시 기술을 이용해 직원들의 배치를 전환하거나 휴식 시간의 길이를 조정함으로써 생산성을 높이고 결과적으로 이윤을 높이는데 활용한다는 입장임


AI 기술의 진전이 마인드 리딩을 손에 잡히는 기술로 만들고 있기 때문에, 이제는 공상이 아니라 이 기술을 이용해 실용적이고 생산성을 향상시킬 수 있으며 사용하기가 즐거운 애플리케이션을 어떻게 개발할 것인지를 고민해야 할 때임