애플, 음성+표정+증강현실로 감정 접속…얼굴표정 인식 업체 ‘이모션트’ 인수

 

Emotient

애플이 얼굴표정 인식 기술개발 스타트업인 ‘이모션트(Emotient)’를 인수했다. 월스트리트저널(WSJ) 등 외신들은 애플이 지난 7일(현지시간) 얼굴표정을 인식하는 스타트업 이모션트를 인수했으며, 인수하는 데 소요된 구체적인 비용에 대해서는 공개되지 않았다고 전했다. 

캘리포니아 주 샌디에이고에 위치한 이모션트는 지난 2012년 설립된 스타트업으로 사용자들이 참여할 수 있는 '크라우드소싱(crowdsourcing)'을 활용해 감정을 최대 10만 가지 표정을 수집하고 분석하는 기술을 개발해 특허까지 보유하고 있다. 

이 기술은 범죄심리학 분야의 세계적인 석학인 폴 에크만(Paul Ekman) 전 캘리포니아 의과대 교수가 1970년대에 발표한 5000여개의 안면 근육 움직임 등 표정, 몸짓, 목소리 같은 미세한 행동 패턴을 통해 거짓말을 알아내고, 상대방이 어떤 감정 상태인지를 잡아내는 자료를 근거로 감정을 추론하는 알고리듬을 개발했다. 

이모션트 웹사이트에 따르면 이 기술은 어두운 조명, 저사양의 웹캠, 안경이나 수염 등으로 가려진 얼굴 등 열악한 환경에서도 표정을 잡아낼 수 있을 뿐만 아니라, 1080p 해상도의 영상 안에서 최대 100명까지 얼굴을 정확히 인식할 수 있다고 한다.

이 얼굴표정 인식 기술은 병원에서 환자를 치료 중 고통을 느끼는 표정을 읽어 의사에게 전달하고, 기업은 TV 프로그램이나 광고에 대한 시청자의 반응, 매장에서 제품별로 소비자들의 호감도, 강연이나 학술 연구 발표에 대한 청중의 반응 등을 확인하는 데 유용하다.

얼굴표정 인식 기술은 페이스북(Facebook)과 구글 알파벳(Google Alphabet)이 관련 기술에 잇따른 투자 계획을 공개하고 있으며, 마이크로소프트(Microsoft), 스냅챗(Snapchat), 플립보드(Flipboard), 핀터레스트(Pinterest) 등도 인공지능 핵심 기술로 개발 중에 있다. 

애플은 사람의 심리를 분석하는 기술에 지속적으로 관심을 보여 왔는데 지난 2014년에 얼굴 표정과 여러 움직임을 통해 사람의 감정을 분석하는 소프트웨어 알고리듬을 특허출원 했다. 따라서 이모션트 인수를 통해 관련 기술 개발에 가속도를 낼 것으로 보인다. 

그런데 흥미로운 것은 개개인의 얼굴 이미지를 저장하지 않고도 표정을 인식할 수 있는 이모션트 기술이 ‘사생활 보호’에 방점 둔 애플의 정책에 부합한다는 것이다. 지난 2015년 10월에 인수한 영국 인공지능(AI) 스타트업인 ‘퍼셉티오(Perceptio)’ 역시 스마트폰에서 아주 적은 데이터를 ‘딥러닝(deep learning)’을 이용한 이미지 인식 프로그램 기술 업체이다. 

퍼셉티오가 다른 딥러닝 기술과 차별화되는 부분은 이미지 인식 딥러닝 기술 대부분 이미지 분석을 위해 많은 양의 데이터를 요구하고 있으나 퍼셉티오의 인공지능 기술의 핵심은 적은 데이터로만 컴퓨터가 미리 이미지를 인식하고, 이 이미지를 어떻게 읽어낼 것인지 학습하도록 했기 때문이다. 퍼셉티오를 이끄는 니콜라스 핀토와 잭 스톤은 모두 인공지능 개발자로 이미지 인식과 분석에 특화된 기술을 갖고 있는 것으로 알려졌다.

이처럼 애플은 인공지능 분야에서 구글이나 페이스북과는 다른 기술을 개발하는 것으로 추측이 되며, 지난 2015년 10월에 자연언어처리 음성인식에 관련 기술업체 ‘보컬IQ’도 인수, 인간처럼 잘 보고 듣는 음성인식과 이미지 분석 성능을 향상 시키는데 주력하고 있다. 

Perceptio
▲ 영국 인공지능(AI) 스타트업 퍼셉티오(Perceptio).

한편, 관련 업계는 이번 이모션트 인수가 미래의 먹거리로 가상현실(VR; virtual reality)/증강현실(AR; augmented reality)에 중점을 두고 지난해 5월 애플이 독일 증강현실 업체 메타이오(Metaio)를 인수한 것과도 연관이 있을 것으로 보고 있다. 

메타이오는 구글 글래스와 같은 웨어러블 장치에서 현실에 디지털을 입히는 기술을 개발해왔다. 메타이오 기술은 페라리의 가상현실 쇼룸에서 마치 아직도 베를린 장벽에 있는 것처럼 보여줬다. 이 기술은 앞으로 아이폰 카메라를 이용해 레스토랑, 카페 등 지역 명소들의 정보를 겹쳐보이게 하고 사용자들의 반응을 살펴 볼 수 있다.

Metaio
▲ 독일 증강현실 업체 메타이오(Metaio).

애플의 증강현실 기업 '메타이오' 인수는 구글을 비롯한 페이스북 등 글로벌 IT 기업들이 집중 투자를 하고 있는 증강 현실 시장에 진출하기 위한 포석으로 분석된다. 미래 먹거리의 핵심 영역으로 평가되는 증강현실 시장은, 현재 구글의 구글 글래스(Google glass)와 마이크로소프트의 윈도10(Windows 10)을 기반으로 하는 '홀로렌즈(Holo lens)', 페이스북인 인수한 가상현실(VR) 회사 오큘러스 등 관련 시장에서 치열한 경쟁을 벌이고 있다. 

그 외에 아마존(Amazon) 또한 헤드기어 등 전용장비 없이 프로젝터와 카메라만으로 증강현실을 구현하는 특허를 출원했으며, 이 기술은 앞으로 음식인식 기능을 갖춘 ‘에코’ 스피커 등과 융합하는 증강 현실 서비스를 준비하고 있는 것으로 알려졌다.

faceshift
▲ 모션캡처 스타트업 페이스시프트(Faceshift).

또 애플은 지난해 11월, 국내 개봉 영화 ‘스타워즈: 깨어난 포스’스타워즈 제작에  참여한 스위스 취리히 소재 모션캡처 스타트업 ‘페이스시프트’(Faceshift)를 인수했다. 이 또한 관련 업계는 애플의 증강현실 분야 연구 개발의 연장선상이라는 분석이다.

애플이 추진하고 있는 인공지능은 산업 전분야에 걸쳐 적용하고 있는 것으로 보인다. 보컬IQ 인수는 최근 자동차업체 GM과도 음성인식서비스 기술개발에 협력하고 있다. 자동차의 내비게이션과 대시보드를 음성으로 동작할 수 있는 ‘카플레이’와 무인 전기자동차와 관련된 기술을 개발하고 있는 것으로 알려졌다.

결국 시리를 통해 음성만으로 애플 기기 모두를 동작할 수 있는 통합적 인터페이스 기능으로 자동차 연계 서비스 '카플레이', 애플TV, 사물인터넷 플랫폼인 ‘홈킷’ 등 모두 음성명령으로 동작하는 것이다.

여기에 애플은 지난해 ‘머신러닝’과 관련된 인공지능 연구진을 86명 이상 대거 영입해 시리의 성능을 높이는데 총력을 기울이고 있는 것으로 알려졌다.

차원용 아스팩미래기술경영연구소 소장 겸 국가과학기술심의회 ICT융합전문위원은 “구글은 고객의 빅 데이터 기반 머신러닝을 적용하지만 애플은 고객의 데이터를 저장하지 않는다고 발표한 바 있다. 따라서 애플 머신러닝은 스트리밍 방식의 리얼타임으로 지역별, 데모그래픽(demographic)별로 제공하는 것으로 추측된다. 즉, 고객을 인구학적으로 세분화시켜, 즉 국가・지역・나이・성별・직업・수입・정서・교육수준 등의 세그먼트별로 그것도 리얼타임으로 분석해 제공하는 것으로 보인다”고 말했다. 이어서 “거기다 얼굴표정 인식 기술이 더해지면 그야말로 구글과 마이크로소프트, 페이스북 등 경쟁 기업을 단숨에 앞설 것으로 보인다”고 말했다.

일반적으로 소통과 관련된 이론 중 가장 많이 인용되는 이론으로 메라비언 법칙이 있다. 캘리포니아대학교 로스앤젤레스캠퍼스(UCLA) 심리학과 명예교수인 앨버트 메라비언(Albert Mehrabian)의 1971년 저서 ‘침묵의 메시지(silent message)'를 통해 한 사람이 상대방으로부터 받는 이미지는 시각적인 요소가 55%, 청각이 38%, 언어가 7%의 비율로 영향을 받아 결정된다는 것이다. 즉, 말은 7%만 담당하고 나머지 93%가 표정·소리와 같은 비언어적 수단을 통해 이뤄진다.  

감정을 읽는다는 건 곧 기업의 매출 증대로 직결된다. 현재는 사물인터넷과 센서 기술이 우리가 움직이는 곳곳을 감지하지만, 아직까지 미개척지인 센서로는 감지하기 어려운 사람의 생각이나 감정을 애플이 접속하려 하고 있다. 그것도 빅 데이터 기반으로 하는 경쟁 기업들과 전혀 다른 방식을 시도하고 있는 것이다.

[김들풀 기자  itnews@itnews.or.kr]