구글, 자연어처리 약점 ‘의역’ 극복 데이터 셋 공개

자연어처리(NLP) 알고리즘은 단어의 순서와 구문 구조는 문장의 의미에 큰 영향을 미친다. 이 문제를 극복하기 위해 구글이 새로운 데이터 세트를 공개했다.  이 데이터 세트에서 훈련을 실시하면, 기계학습 모델의 텍스트 분류 정확도가 50%에서 80%까지 향상해 준다. 구글은 기계번역과 음성인식에서 자연어처리를 적용하고 있다. 하지만, 자연어처리에서 단어순서가 하나만 바뀌어도 해석이 완전히 다를 수 있다.

이 콘텐츠는 사이트 회원 전용입니다. 기존의 사용자라면 로그인 하세요. 새 사용자는 아래에서 회원가입 할 수 있습니다.

기존 사용자 로그인
   
새로운 사용자 등록
*필수란