Google Duplex : 전화를 통해 실제 업무를 수행하는 AI 시스템

인간과 컴퓨터의 상호 작용에 대헤 오랫동안 지속된 목표는 사람들과 컴퓨터를 자연스럽게 대화 할 수있게 하는 것이 었습니다. 최근 몇년 동안, 우리는 컴퓨터의 능력이 자연어를 이해하고 생성하는 혁명을 목격했습니다. 특히 심신경망(예 : Google 음성 검색, WaveNet). 아직도 오늘날의 최첨단 시스템에서도 자연어를 이해하지 못하는 부족한 컴퓨터 목소리와 이야기하는 것에 좌절하는 경우가 많습니다. 특히 자동화된 전화 시스템은 여전히 ​​간단한 단어와 명령을 인식하는 데 어려움을 겪고 있습니다. 대화 […]

OpenSeq2Seq

NVIDIA의 공식 제품이 아닌 연구 프로젝트입니다. OpenSeq2Seq은 다양한 sequence-to-sequence 모델을 이용한 효율적인 실험을 위한 툴킷입니다. 주요 특징 : 분산형 학습 : 다중 GPU, 다중 노드 지원 GPU에서 효율적인 혼합 정밀 학습을 위한 내장 모듈식 디자인과 유연한 구성으로 새로운 모델을 쉽게 만들고 다양한 encoder-decoder 조합을 실험, CNN 기반 encoder와 RNN 기반 decoder 등을 결합 speech-to-text, text-to-text 및 […]

CRISP-DM 방법론

CRISP-DM은 데이터 마이닝을 위한 업계 사이의 프로세스 약자입니다. CRISP-DM 방법론은 데이터 마이닝 프로젝트를 계획하기 위한 체계적인 접근 방식을 제공합니다. 강력하고 검증된 방법론입니다. 강력한 실용성, 유연성과 첨단 비즈니스 문제를 해결하기 위해 분석을 사용할 때의 유용성이 뛰어납니다. 이 모델은 이상적인 일련의 이벤트입니다. 실제로 많은 작업이 다른 순서로 수행 될 수 있으며 이전 작업으로 되돌아가서 특정 작업을 반복해야 할 경우도 종종 있습니다. 이 모델은 데이터 마이닝 […]

딥러닝을 위한 하드웨어

현재 사용되는 신경망(NN, 딥러닝)에 대한 두가지 별개의 작업 모드가 있습니다. 훈련(특정 작업을 해결하기 위해 설계된 NN에 대한 가중치 세트 학습)과 추론(훈련된 NN 사용)입니다. 훈련은 추론보다 계산 집약적인 과정입니다. 많은 응용 프로그램에서 이 두 모드를 분리하지만 일부 작업(예 : Deep RL)에는 두모드의 긴밀한 통합이 필요할 수 있습니다. 딥러닝은 비트코인이 거치는 과정과 같은 방식으로 진행됩니다. 채굴 대신 […]

Intel Movidius Neural Compute Stick을 Raspberry Pi 3에 장착하여 개발하기

최근 저전력 소비는 자율/무인 차량이나 IoT 장치에 없어서는 안될 필수 요소입니다. 초기부터 딥러닝 추론 응용 프로그램을 개발하기 위해 Intel의 에너지 효율적이고 저렴한 Movidius USB 스틱을 사용할 수 있습니다. Movidius Neural Compute Stick(NCS)은 Intel에서 생산되며 Intenet 없이도 실행할 수 있습니다. NCS의 SDK를 사용하면 딥러닝 신경망의 신속한 프로토 타이핑, 검증 및 배포가 가능합니다. 도구를 사용하여 개발 컴퓨터에서 […]

데이터 과학자가 알아야 할 5가지 클러스터링 알고리즘

클러스터링은 데이터 포인트의 그룹화와 관련된 머신러닝 기술입니다. 데이터 포인트 집합이 주어지면 클러스터링 알고리즘을 사용하여 각 데이터 포인트를 특정 그룹으로 분류 할 수 있습니다. 이론적으로 같은 그룹에 속한 데이터 요소는 비슷한 속성 및 / 또는 피처를 가져야 하지만 다른 그룹의 데이터 요소는 매우 다른 속성 및 / 또는 피처를 가지기도 합니다. 클러스터링은 비지도 학습의 한 방법이며  많은 분야에서 사용되는 통계 데이터 […]

워드벡터 훈련 및 시각화

이 튜토리얼에서는 TensorFlow에서 Skip-gram 모델을 구현하여 작업중인 모든 텍스트에 대한 워드벡터를 생성 한 다음 Tensorboard를 사용하여 시각화하는 방법을 보여줍니다. 이 연습은 i) Skip-gram 모델을 이해하고 ii) CNN 또는 RNN에서 downstream을 사용하기 전에 이러한 벡터가 텍스트에 대해 캡처하는 관계의 종류에 대한 느낌을 얻는 데 매우 유용합니다. 필자는 영어 Wikipedia 기사 모음인 text8 데이터세트에서 Skip-gram 모델을 학습했습니다. Tensorboard를 사용하여 임베딩을 시각화했습니다. Tensorboard를 사용하면 […]

.NET 환경으로 머신러닝 모델을 배포하는 방법

Python과 R은 데이터 중심의 엔지니어에게 가장 인기있는 프로그래밍 언어입니다. 그러나 응용 프로그램의 나머지 부분에서 항상 빌드되는 언어는 아닙니다. 따라서 Python 또는 R로 작성된 머신러닝 모델을 .NET과 같은 언어 기반 환경에 배포 할 수있는 방법을 찾아야하는 경우가 있습니다. 이 글에서는 웹 API를 사용하여 머신러닝 모델을 .NET으로 작성된 응용 프로그램에 통합하는 방법을 보여줍니다.     .NET 환경에 […]

DAN (Deep Average Networks) : 대화형 봇에 대한 토픽 기반 평가

대화 평가는 어려운 문제입니다. 특히 대화를 성공으로 잘 정의 할 수 없는 작업 중심의 대화 상자가 아닌 경우에 특히 그렇습니다. 우리는 대화형 봇이 주제에 대해 일관되고 매력적인 대화를 유지할 수 있는 능력과 봇이 처리 할 수 있는 주제의 다양성을 설명하는 토픽 기반 메트릭을 사용하여 대화 품질을 평가할 것을 제안합니다. 발화마다 대화 주제를 탐지하기 위해 DAN […]

Skip-Thought Vector의 PyTorch 구현

“Skip-Thought Vector”또는 “Skip-Thoughts”는 라벨 데이터 또는 비지도학습으로 자연어 문장의 고정 길이 표현을 학습하는 간단한 신경망 모델에 부여된 이름입니다. Skip-Thoughts가 사용하는 유일한 지도/학습시그널은 자연어 코퍼스에서의 문장의 순서입니다. 고정된 표현을 사용하면 문장을 equivalent vector로 쉽게 대체할 수 있습니다. 이것은 자연어에 대한 이해, 행동 또는 반응 과정을 수학적으로 직접적으로 만듭니다. 이러한 작업의 몇가지 예는 다음과 같습니다. -두 문장의 […]