Google Duplex : 전화를 통해 실제 업무를 수행하는 AI 시스템

인간과 컴퓨터의 상호 작용에 대헤 오랫동안 지속된 목표는 사람들과 컴퓨터를 자연스럽게 대화 할 수있게 하는 것이 었습니다. 최근 몇년 동안, 우리는 컴퓨터의 능력이 자연어를 이해하고 생성하는 혁명을 목격했습니다. 특히 심신경망(예 : Google 음성 검색, WaveNet). 아직도 오늘날의 최첨단 시스템에서도 자연어를 이해하지 못하는 부족한 컴퓨터 목소리와 이야기하는 것에 좌절하는 경우가 많습니다. 특히 자동화된 전화 시스템은 여전히 ​​간단한 단어와 명령을 인식하는 데 어려움을 겪고 있습니다. 대화 흐름에 관여하지 않으며 사람이 시스템에 적응하도록 하고 있습니다.

Google에서는 전화를 통해 “실제”작업을 수행하기 위해 자연스러운 대화를 수행하는 새로운 기술인 Google Duplex를 발표합니다. 이 기술은 특정 유형의 약속을 예약하는 것과 같은 특정 작업을 완료하기 위한 것입니다. 이러한 작업을 위해 시스템은 가능한 한 자연스러운 대화 경험을 제공하여 사람들이 컴퓨터에 적응하지 않고 다른 사람과 대화하듯이 정상적으로 말하게합니다.

주요 연구 결과 중 하나는 Duplex를 광범위하게 탐색 할 수있는 좁은 폐쇄 도메인으로 제한하는 것이 었습니다. Duplex는 이러한 영역에서 딥러닝을 통해 ​​자연스러운 대화를 수행 할 수 있습니다.

이 예는 완전 자동 컴퓨터 시스템과 실제 비즈니스 간의 대화입니다.

Google Duplex 기술은 자연스럽게 들리도록 설계되어 대화를 편안하게 해줍니다. 사용자와 기업이 이 서비스에 대해 좋은 경험을 갖고 있다는 사실은 중요합니다. 투명성이 핵심 요소입니다. 기업들이 전화의 의도를 분명히 하고 비즈니스가 컨텍스트를 이해할 수 있기를 바랍니다. 우리는 앞으로 몇 개월 동안 올바른 접근법을 실험 할 것입니다.

자연스러운 대화 진행하기
자연어를 이해하기 어렵고, 자연스러운 행동을 모델로 삼기 쉽고, 지연 시간에 대한 빠른 처리가 필요하며, 적절한 억양으로 자연스러운 음성을 생성하는 것은 어렵습니다.

사람들은 서로 이야기 할 때 컴퓨터와 대화 할 때보 다 복잡한 문장을 사용합니다. 종종 중간 문장을 바로 잡거나, 필요한 것보다 더 장황하거나, 단어를 생략하고 대신 문맥에 의존합니다. “화요일부터 목요일까지 우리는 11시에서 2시까지 열려 있고 4시에서 9시까지, 그리고 금요일, 토요일, 일요일 우리는 … 또는 금요일에 다시 문을 엽니다. 토요일은 11시부터 9시까지, 그리고 일요일은 1시부터 9시까지 열려 있습니다. “

자연스러운 말하기에서 사람들은 기계에 말을 할 때보 다 빠르고 명확하게 말함으로써 음성 인식이 어렵고 단어 오류율이 높아집니다. 전화가 걸려 오는 중에 문제가 심각해지므로 배경 소음 및 음질 문제가 큽니다.

더 긴 대화에서 동일한 문장은 문맥에 따라 매우 다른 의미를 가질 수 있습니다. 예를 들어 예약시 “Ok for 4″는 예약 시간 또는 인원 수를 의미 할 수 있습니다. 관련 문맥은 여러 문장으로되어 있을 수 있으며, 전화 통화에서 단어 오류율이 증가하여 문제가 발생합니다.

 

 

무엇을 말할 것인지 결정하는 것은 작업과 대화의 상태 모두의 기능입니다. 또한, 일상의 대화에서 몇 가지 일반적인 관행이 있습니다.

이하 원문 참조

원문

https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html

Tags:

Google Duplex

Duplex

듀플렉스