퀄컴의 엣지인공지능칩(Edge AI Chip)-NPU 개발 동향


퀄컴(Qualcomm)의 인공지능 칩(AI Chip) 개발은 특허분석 결과 2010년으로 거슬러 올라간다. 그 후 2013년 10월 10일, 자사 블로그를 통해 인간의 Spiking Neural Networks(SNNs)를 모방한 뇌처럼 학습하는 프로세서(Neural Processing Unit, NPU, 신경망 처리 장치)인 '제로스(Zeroth)'를 공개했다. NPU는 사람의 뇌를 구성하는 신경망에서 아이디어를 얻었다. 

<그림> Qualcomm의 SNNs베이스의 NPU인 Zeroth(2013). Image source: Qualcomm 

제로스는 인공 뉴럴 네트워크를 구현하기 위해 퀄컴 R&D팀이 제시한 새로운 프로세서 아키텍처로, 3가지 명확한 목적을 가지고 설계됐다. 

첫째, 생물체처럼 학습하는 능력(Biologically Inspired Learning)을 가져야 하고, 둘째, 인간처럼 주변 환경을 인식하는 능력(Enable Devices To See and Perceive the World as Humans Do)을 가져야 하며, 셋째, NPU 개념 정립(Creation and definition of an Neural Processing Unit)이다.

생물체처럼 학습하는 능력이란 무엇일까. '스스로 판단한다'로 정의할 수 있다. 지금까지 컴퓨터는 인간이 내린 명령에 대한 결과 값만을 도출해냈다. 하지만 제로스를 탑재하면 조금 얘기가 다르다. 

퀄컴은 동영상을 통해 스스로 판단한다는 개념을 설명했다. 먼저 제로스를 탑재한 한 로봇에 색깔이 칠해진 타일을 찾으라는 명령을 내렸다. 그 결과 로봇은 기존 타일과 색상이 다른 6가지 타일을 찾아냈다. 여기까지는 일반적인 컴퓨터와 같다. 

그다음 하얀색 타일을 찾은 로봇에게 '칭찬한다'는 명령을 내렸다. 그러자 로봇은 칭찬한다는 명령 다음에 어떤 행동을 하라고 지시하지 않았음에도, 알아서 '스스로' 또 다른 하얀 타일을 찾아냈다. 이것이 ‘스스로 판단 한다’의 핵심이다.

인간처럼 주변 환경을 인식하는 능력이란 '뇌와 유사한 구조를 가지고 있다'는 뜻이다. 퀄컴은 뇌의 신경세포를 연구해 뇌 동작 특성에 관한 수학적 모델을 만들었다. 일단 뇌 신경 세포의 세포막에 특정 전압(인식)이 가해지면 두뇌신호(스파이크)가 생성된다는 사실을 파악했다. 

뇌는 이 스파이크 신경망 네트워크(SNNs)를 통해 감각을 받아들이는데, 이러한 구조를 제로스에 적용했다는 것이 퀄컴의 설명이다.

NPU란 인공 뉴럴 네트워크를 구현하기 위한 프로세서 유닛(신경망 처리 장치)이다. 원래 프로세서는 코어(센트럴) 프로세서 유닛(CPU), 그래픽 프로세서 유닛(GPU), 디지털신호처리기(DSP) 등 종류가 다양하다. 퀄컴의 최종 목적은 NPU의 개념을 정립하고, 이를 스마트폰 AP(Application Processor)에 포함시키는 것이다

CPU, GPU, DSP, 센서, 통신칩셋 등으로 구성된 스마트폰 AP에 NPU가 포함되면 스마트폰은 또 한 차례 큰 도약을 이뤄낼 전망이다. 

터치스크린과 애플리케이션을 통해 명령을 내려야만 임무를 수행하던 스마트폰이 스스로 알아서 판단하고 유용한 정보를 찾아내 이를 사용자에게 알려주는 것이다. 

또, 인간의 결정보다 더 나은 판단을 찾아내 이를 대신 보여줄 수도 있다. 소프트웨어로 구현해야 했던 예전과 달리 스마트폰이 하드웨어적으로 판단한다는 것이 가장 큰 차이점이다. 작아진 컴퓨터가 아니라 진정 스마트한 전화기다. 

NPU의 또 다른 특징이 있다. 사람은 오감(五感)을 통해 인식한 수많은 정보를 뇌에서 동시에 처리하고 반응한다. 음성을 인식할 때에도 청각에만 의존하는 것이 아니라 오감을 통해 인식한다. 

이는 사람의 뇌가 하나의 특정한 처리 장치로 움직이는 것이 아니라 수많은 뉴런(신경세포)이 동시다발적으로 작동하기 때문에 가능한 일이다. 

NPU는 사람의 뇌에 있는 뉴런처럼 수많은 코어를 갖고 있다. 적게는 수십 개에서 많으면 수천 개의 코어가 동시에 작동한다. NPU는 음성이나 사진처럼 엄청난 양의 연산이 필요한 데이터 처리와 분석에 최적화된 연산 시스템이다. 

현재의 CPU나 AP는 계산을 최대한 정확하게 하도록 설계돼 있는 반면, NPU는 입력된 데이터 중에서 소수점 이하 부분 같은 구체적인 부분은 과감히 생략해 근삿값을 만든 뒤 동시에 많은 계산을 진행하도록 한다. 

데이터를 생략하면 반도체칩의 구조는 단순해지는 반면 속도는 빠르고 소비 전력도 획기적으로 줄일 수 있다. 다만 근삿값을 사용해 연산한 NPU는 완벽한 계산 결과를 내놓지는 않는다. 

AI 서비스나 음성·이미지 인식의 경우 하나의 정확한 정보를 얻어내는 것보다 최대한 많은 데이터를 동시에 처리하는 것이 더 정확한 답을 내놓을 수 있는 방법이기 때문이다. 

몇몇 사람을 대상으로 물어보는 것보다 더 많은 사람을 설문조사 할수록 여론조사 결과가 정확해지는 것과 마찬가지이다.

<그림> 제로스(Zeroth) 브랜드가 죽고 그 대신 NPU가 탑재된 스냅드래곤(Snapdragon) 프로세서. Image: Qualcomm

2016년 5월에 Qualcomm은 NPU가 탑재된 스냅드래곤(Snapdragon) 820 프로세서부터 제로스 SDK가 적용된다고 발표했고, 그때부터 제로스(Zeroth) 브랜드가 죽었으며, 2016년 9월부터 몇몇 개발 파트너들과 작업을 하다가 2017년 7월에 SDK가 완전히 공개되었다. 

현재는 제로스 브랜드가 죽고, 제로스 사이트도 폐쇄되었으며, Snapdragon의 AI로 통일해, 지금은 스냅드래곤(Snapdragon) 845와 855 AP에 AI 기술력을 집약했다. 

퀄컴의 3세대 AI 모바일 플랫폼인 스냅드래곤 845는 전작인 스냅드래곤 835 대비 AI 성능이 약 3배 향상됐다. 개인 비서(Personal Assistance) 역시 정확한 판단과 빠른 조작, 그리고 자연스러운 응답이 가능해졌다. 

더욱이 NPU의 AI가 에지(Edge, 디바이스)에서 직접 돌아가므로 클라우드에 접속할 필요가 없다. 따라서 이를 On-device(Edge) AI라고 하는데, 데이터가 클라우드에서 디바이스로 이동하기(Cloud -> Edge) 때문에, 많은 기업들이 Edge AI에 도전하고 있다. 

자 다음부터는 NPU가 탑재된 스냅드래곤(Snapdragon) 820-835-845-855가 나오게 된 배경인 특허를 분석하기로 한다.

 

차원용 소장/교수/MBA/공학박사/미래학자 

아스팩미래기술경영연구소(주) 대표, (전)국가과학기술심의회 ICT융합전문위원회 전문위원, 국토교통부 자율주행차 융복합미래포럼 비즈니스분과 위원, 전자정부 민관협력포럼 위원, 국제미래학회 과학기술위원장