‘머신러닝 알고리즘’으로 박쥐들의 대화 번역

egyptian-fruitbat-arp
▲ Image Source: England Cotswold Wildlife Park

박쥐가 내는 끽끽 소리에는 미묘한 뉘앙스가 숨어있다. 그들의 일상적인 발성은 특정 개체를 향한 '메시지'로, 불특정 다수를 향한 '방송'이 아니다. 그리고 얼핏 들으면 다 그게 그거 같지만, 그들의 소리에는 발신인(emitter), 수신인(addressee), 맥락(context), 행동(behavior)에 관한 정보가 담겨있다.

동물의 세계에서 벌어지는 말다툼을 엿들으려고 굳이 <둘리틀 박사의 바다 모험>에 나오는 여러 동물들과 대화 할 줄 아는 괴짜 시골 의사 둘리틀 박사까지 될 필요는 없을 것 같다. 이집트 과일박쥐(Rousettus aegyptiacus)를 연구하는 과학자들은 "박쥐들이 내는 소리들을 분석해 '누구와 누가 말다툼을 하는지', '도대체 무슨 일로 옥신각신하는지'를 알아내고, 심지어 '말다툼의 결말이 어떻게 날 것인지'까지도 예측하는 방법을 개발했다"고 한다.

이번 연구의 공동저자인 이스라엘 텔아비브 대학교(Tel Aviv University in Israel)의 요시 요벨(Yossi Yovel) 박사(동물학과)는 "'인간의 언어는 어디에서 왔는가?'는 전 세계적인 관심사다. 이 의문을 해결하려면, 먼저 동물의 의사소통을 연구해야 한다. 그리고 동물의 의사소통(참고)에 관한 큰 의문 중 하나는 '얼마나 많은 정보가 전달되는가?'이다"라고 말했다.

이어 "아프리카와 중동 지방에서 흔히 서식하는 이집트 과일박쥐는 사회적 동물이다. 그러나 그들이 옹기종기 모여 쉴 때 내는 소리를 인간의 귀로 분간하는 것은 거의 불가능하며, 그저 모두 공격적인 소리로 들릴 뿐이다. 기본적으로 그들은 서로를 향해 고래고래 소리를 지른다"고 설명했다.

그러나 요벨 박사가 이끄는 연구진은 <Scientific Reports>에 기고한 논문에서, 박쥐들이 끽끽 거리는 소리들의 의미를 어떻게 분석하게 되었는지를 차근차근 설명했다(참고).

연구진은 기존 인간의 음성을 인식하는 데 사용되는 머신러닝(machine learning) 알고리즘을 활용했다. 머신러닝 알고리즘은 일종의 인공지능(AI)으로서, 훈련 데이터(Training Data)를 통해 학습된 알려진 속성을 기반으로 예측에 초점을 두고 있다. 알고리즘 유형으로는 지도 학습, 자율 학습, 준 지도 학습, 강화 학습, 심화 학습 등이 있다.

연구진은 ▷ 먼저 22마리의 박쥐들을 두 그룹으로 나눠 별도의 케이지에서 사육하면서, 75일간에 걸쳐 오디오와 비디오 영상을 기록했다. ▷ 그런 다음 비디오 영상을 분석하면서, 연구진은 '어떤 박쥐들이 서로 언쟁을 벌이는지'와 '각각의 언쟁은 어떻게 결말이 나는지'를 일일이 규명하여, ▷ 그들이 옥신각신하는 의도를 크게 네 가지로 분류했다. ① 잠자리를 둘러싼 다툼, ② 먹이를 둘러싼 다툼, ③ 횃대에서의 자리다툼, ④ 짝짓기를 둘러싼 갈등(원치 않는 상대의 집적거림)

▷ 그 다음으로, 연구진은 일곱 마리의 암컷 성체(adult female)들이 내는 약 15,000가지 소리들을 이용해 머신러닝 알고리즘을 훈련시켰다. 각 각의 소리들은 시스템의 정확성을 테스트하기 전에 비디오 영상에서 얻은 정보를 이용해 범주화했다.

훈련 결과, 알고리즘은 소리의 주파수만을 근거로 어떤 박쥐(emitter)가 내는 소리인지를 분간하고(정확도: 71%), 그들이 무슨 문제로 언쟁을 하는지를 알아내는(정확도: 61%) 것으로 밝혀졌다. 그리고 정확도는 떨어지지만, 특정 소리가 누구(addressee)를 겨냥하는지도 알아냈고, '언쟁의 결말은 무엇인지, 박쥐들이 결별할 것인지 말 것인지, 만약 결별한다면 누가 떠날 것인지'를 예측할 수 있는 것으로 밝혀졌다.

이집트 과일박쥐가 내는 소리의 독특한 유형 

srep

▲ A: 짝짓기, B: 고립, C: 스트레스, D: 반향정위(echolocation) E: ① 먹이를 둘러싼 다툼, ② 짝짓기를 둘러싼 갈등, ③ 횃대에서의 자리다툼, ④ 잠자리를 둘러싼 다툼 F, G: 하루 일과 중 언성이 높아질 때

요벨 박사는 "소리의 차이에는 미묘한 뉘앙스가 있다. 우리가 발견한 것은, 특정한 음높이(pitch) 차이가 서로 다른 범주를 특징짓는다는 것이다. 그러나 그렇다고 해서 '짝짓기와 관련된 소리가 고음이고, 먹이다툼과 관련된 소리가 저음이다'라고 일률적으로 말할 수는 없다"라고 말했다.

이어 "이번 연구에 의하면, 박쥐들이 매일 일상적으로 내는 소리에도 풍부한 정보가 담겨있는 것으로 보인다. 우리가 종전에 '여기서 꺼져!'라고 알고 있었던 발성(vocalization)에도 사실은 많은 정보들이 담겨있는 것으로 밝혀졌다. 음높이 말고도, 향후 패턴이나 강세(stress)와 같은 요소들까지 추가로 분석하면, 박쥐의 소리에 코딩되어 있는 정보를 좀 더 상세하게 알아낼 수 있을 것이다"라고 덧 붙였다.

유니버시티칼리지런던(UCL)의 케이트 존스(Kate Jones) 박사(생태학, 생물다양성)는 "박쥐의 사회적 행동을 해석한 것은 로제타석(Rosetta stone)에 새겨진 글귀를 해독한 것이나 마찬가지다. 박쥐의 발성을 일부 해독하고, 그 속에는 지금껏 우리가 생각했던 것보다 훨씬 더 많은 정보가 포함되어 있음을 알아냈다니 참으로 대단하다"라고 평가했다.

이어 존스 박사는 “연구진이 사용한 '박쥐들 간의 사회적 신호에 기반을 둔 접근방법'을 이용하면, 다른 동물들의 의사소통 방법을 연구하는 데도 도움이 될 것으로 보인다. 그렇게 될 경우, 동물의 의사소통을 이해하는 새 세상이 열리게 될 것이다"라고 말했다.

논문초록 

음성을 이용한 동물의 의사소통은 종종 다양하고 구조화되어 있다. 그러나 동물의 발성 속에 숨어있는 정보는 아직 알려지지 않았다. 많은 선행연구들에 의하면, 동물들이 내는 소리에는 발신자(emitter)와 맥락(context)에 대한 정보가 담겨있다고 한다. 그러나 선행연구들은 종종 특정한 종류의 소리만을 집중적으로 연구했다. 왜냐하면, 모든 레퍼터리를 한꺼번에 분석한다는 게 거의 불가능하기 때문이다. 
우리는 이번 연구에서, 이집트 과일박쥐들이 내는 소리를 몇 달 동안 연속적으로 모니터링하며, 오디오와 비디오를 하루 24시간씩 내내 기록했다. 우리는 박쥐들이 일상적인 상호작용에 수반되는 15,000개의 발성을 분석하여, 모든 발성은 특정 개체를 향한 '메시지'이며, 불특정 다수를 향한 '방송'이 아니라는 사실을 발견했다. 

또한 박쥐의 발성에는 ① 발신자의 신원, ② 소리의 맥락, ③ 소리에 대한 행동반응, ④ 수신자의 신원에 대한 정보가 풍부하게 담겨있는 것으로 밝혀졌다. 이번 연구결과는 동물이 일상적으로 음성을 이용하여 1:1로 '목표지향적 상호작용'을 한다는 것을 시사한다. 출처: The Guardian

위 글은 생물학연구정보센터(BRIC)에 등재된 양병찬 번역가의 글을 옮겨 싣는다. 양병찬 약사/과학 전문 번역가는 서울대학교 경영학과와 같은 대학원을 졸업한 후 은행, 증권사, 대기업 기획조정실 등에서 일하다가, 진로를 바꿔 중앙대학교 약학을 공부했다. 현재 약국을 운영하며 의학, 약학, 생명과학 분야 등 과학 번역가로 활발하게 활동하고 있다. 또한 매주 포스텍(POSTECH) 생물학연구정보센터(BRIC)에 네이처(Nature)와 사이언스(Science)에 실리는 특집기사 중 엄선해 번역 소개한다. 최근 번역 출간한 책 '자연의 발명'(2016.7.11.)을 비롯해 ‘나만의 유전자’, ‘영화는 우리를 어떻게 속이나’, ‘매혹하는 식물의 뇌’, ‘곤충 연대기’, ‘가장 섹시한 동물이 살아 남는다’, '센스 앤 넌센스', ‘비처방약품치료학’, ‘커뮤너티파마시’, ‘리더에게 결정은 운명이다’, ‘잇 앤 런’, ‘아트 오브 메이킹 머니’ 등 다양한 분야의 서적들을 번역 출간했다.

[김들풀 기자  itnews@itnews.or.kr]

LEAVE A REPLY

Please enter your name here
Please enter your comment!