[바이두] 상호 작용을 통해 말하기 학습

말하기, 인간의 다른 능력과 함께, 우리의 임무는 기계에 대한 일반적인 지능을 만드는 데 중요한 구성 요소입니다. 오늘날 기계와 간단한 대화를 하는 것은 드문 일이 아니지만 말하기를 가르치는 우리의 접근법은 기존의 방법과 크게 다릅니다.

AI 상담원은 아기와 비슷한 방식으로 말하기를 배웁니다. 대조적으로, 기존의 접근 방식은 정적인 사전 수집 훈련 세트의 큰 코퍼스를 사용하는 감독된 학습에 의존하며 언어 학습 과정에서 대화식 성격을 포착하기 어렵게 만듭니다. 결과적으로, 종래의 방법으로 훈련된 시스템은 주로 제한된 적응성 및 일반화 능력을 갖는 데이터세트의 변화를 반영합니다. AI 에이전트는 대화식으로 대화에 참여함으로써 말하고, 데이터의 통계 패턴을 순수하게 포착하기 보다는 언어 학습 및 이해 능력을 얻는 것을 목표로 합니다.

말하기를 배우면 아기는 사람들과 상호 작용하고 모방과 피드백을 통해 학습합니다. 아기는 처음에는 대화 상대/선생님을 흉내내어 구두로 행동을 취하고 표현력 (예 : 단어 또는 문장)을 습득합니다. 아기는 부모에게 언어 구사를 하고 부모의 교정/격려에 따라 구두 행동을 조정합니다.

연구 개요

상담원이 교사와 상호 작용하고 피드백으로부터 학습하고 자연스러운 언어를 학습함으로써 대화에 참여하면서 언어 기술을 습득하고 향상시키는 기본 자연어 학습을위한 대화형 접근법을 제시합니다. 감독 학습 설정에서와 같이 학습자의 행동을 안내하는 레이블 형태의 직접 감독은 없습니다 . 대신 말하기를 배우기 위해 말을해야 하며, 교사는 자연스런 언어 (예 : 예 / 아니오)와 비언어적 (예 : 끄덕 / 웃음) 피드백을 제공합니다.

여러 다른 양식의 교육중의 대화의 예가 아래의 그림과 같습니다. 처음에 에이전트는 의미없는 문장을 생성하지만 상호 작용을 통해 순전히 대화 기술을 향상시킵니다. 결국 AI 상담원은 교사의 질문에 자연어로 정확하게 대답 할 수 있습니다.

 

에이전트의 언어 학습 능력을 더 잘 보여주는 또 다른 측면은 일반화 능력입니다. 즉, AI 상담원은 교사가 설명했지만 이전에는 질문에 나타나지 않은 개념에 대한 알려진 아이디어 또는 질문의 새로운 조합과 관련된 질문에 대답 할 수 있습니다. 예를 들어, 훈련 도중, {아보카도, 동쪽}의 조합은 질문 응답에 결코 관여하지 않았습니다. 오렌지색의 물체는 묘사되었지만 선생님에게 한번도 물어 본 적이 없습니다. 테스트 중에 에이전트는 “동쪽”에있는 “아보카도”또는 그림에 표시된 “오렌지색”에 관한 질문에 대답 할 수 있습니다.

이 작업의 한 가지 목표는보다 복잡한 언어 동작을 조장하기 위해 언어 학습 환경의 복잡성을 증가시키는 것입니다. 또 다른 목표는 에이전트가 인간과 상호 작용하고 실제 세계에서 효과적으로 학습 할 수 있도록 지식 모델링 및 빠른 학습을 탐구하는 것입니다.

더 자세한 내용은 우리 논문 을 읽으십시오 .