© 2016 by  NEXTOBE Co.,Ltd

TECHNOLOGY

May 14, 2018

인간과 컴퓨터의 상호 작용에 대헤 오랫동안 지속된 목표는 사람들과 컴퓨터를 자연스럽게 대화 할 수있게 하는 것이 었습니다. 최근 몇년 동안, 우리는 컴퓨터의 능력이 자연어를 이해하고 생성하는 혁명을 목격했습니다. 특히 심신경망(예 : Google 음성 검색, WaveNet). 아직도 오늘날의 최첨단 시스템에서도 자연어를 이해하지 못하는 부족한 컴퓨터 목소리와 이야기하는 것에 좌절하는 경우가 많습니다. 특히 자동화된 전화 시스템은 여전히 ​​간단한 단어와 명령을 인식하는 데 어려움을 겪고 있습니다. 대화 흐름에 관여하지 않으며 사람이 시스템에 적응하도록 하고 있습니다....

April 26, 2018

NVIDIA의 공식 제품이 아닌 연구 프로젝트입니다.

OpenSeq2Seq은 다양한 sequence-to-sequence 모델을 이용한 효율적인 실험을 위한 툴킷입니다.

주요 특징 :

  • 분산형 학습 : 다중 GPU, 다중 노드 지원

  • GPU에서 효율적인 혼합 정밀 학습을 위한 내장

  • 모듈식 디자인과 유연한 구성으로 새로운 모델을 쉽게 만들고 다양한 encoder-decoder 조합을 실험, CNN 기반 encoder와 RNN 기반 decoder 등을 결합

  • speech-to-text, text-to-text 및 새롭게 확장되도록 설계된 다양한 입출력 양식을 지원

OpenSeq2Seq는 TensorFlow를...

April 12, 2018

CRISP-DM은 데이터 마이닝을 위한 업계 사이의 프로세스 약자입니다. CRISP-DM 방법론은 데이터 마이닝 프로젝트를 계획하기 위한 체계적인 접근 방식을 제공합니다. 강력하고 검증된 방법론입니다. 강력한 실용성, 유연성과 첨단 비즈니스 문제를 해결하기 위해 분석을 사용할 때의 유용성이 뛰어납니다. 

이 모델은 이상적인 일련의 이벤트입니다. 실제로 많은 작업이 다른 순서로 수행 될 수 있으며 이전 작업으로 되돌아가서 특정 작업을 반복해야 할 경우도 종종 있습니다. 이 모델은 데이터 마이닝 프로세스를 통해 가능한 모든 경로를 포착하려고 하지 않습니다.

각 프로세스 단계는...

March 16, 2018

현재 사용되는 신경망(NN, 딥러닝)에 대한 두가지 별개의 작업 모드가 있습니다. 훈련(특정 작업을 해결하기 위해 설계된 NN에 대한 가중치 세트 학습)과 추론(훈련된 NN 사용)입니다. 훈련은 추론보다 계산 집약적인 과정입니다. 많은 응용 프로그램에서 이 두 모드를 분리하지만 일부 작업(예 : Deep RL)에는 두모드의 긴밀한 통합이 필요할 수 있습니다.

딥러닝은 비트코인이 거치는 과정과 같은 방식으로 진행됩니다. 채굴 대신 훈련은 CPU(Cental Processing Units, ordinary processors from Intel/AMD like Core i7, Ryzen)에서 시작하고, 다음으로 GPU(Graphic Pr...

March 8, 2018

최근 저전력 소비는 자율/무인 차량이나 IoT 장치에 없어서는 안될 필수 요소입니다. 초기부터 딥러닝 추론 응용 프로그램을 개발하기 위해 Intel의 에너지 효율적이고 저렴한 Movidius USB 스틱을 사용할 수 있습니다.

Movidius Neural Compute Stick(NCS)은 Intel에서 생산되며 Intenet 없이도 실행할 수 있습니다. NCS의 SDK를 사용하면 딥러닝 신경망의 신속한 프로토 타이핑, 검증 및 배포가 가능합니다. 도구를 사용하여 개발 컴퓨터에서 DNN을 프로파일링하고 튜닝, 컴파일하는 작업은 Intel Movidius Neural Compute SDK에서 제공됩니다.

Movidius NCS의 계산 기...

February 26, 2018

클러스터링은 데이터 포인트의 그룹화와 관련된 머신러닝 기술입니다. 데이터 포인트 집합이 주어지면 클러스터링 알고리즘을 사용하여 각 데이터 포인트를 특정 그룹으로 분류 할 수 있습니다. 이론적으로 같은 그룹에 속한 데이터 요소는 비슷한 속성 및 / 또는 피처를 가져야 하지만 다른 그룹의 데이터 요소는 매우 다른 속성 및 / 또는 피처를 가지기도 합니다. 클러스터링은 비지도 학습의 한 방법이며  많은 분야에서 사용되는 통계 데이터 분석을 위한 공통 기술입니다.

데이터 과학에서는 클러스터링 알고리즘을 적용 할 때 데이터 포인트가 속하는 그룹을 확인함으로써 클러스터링 분석을 사용하여 데이터에서 가...

February 7, 2018

이 튜토리얼에서는 TensorFlow에서 Skip-gram 모델을 구현하여 작업중인 모든 텍스트에 대한 워드벡터를 생성 한 다음 Tensorboard를 사용하여 시각화하는 방법을 보여줍니다. 

이 연습은

i) Skip-gram 모델을 이해하고

ii) CNN 또는 RNN에서 downstream을 사용하기 전에 이러한 벡터가 텍스트에 대해 캡처하는 관계의 종류에 대한 느낌을 얻는 데 매우 유용합니다.

필자는 영어 Wikipedia 기사 모음인 text8 데이터세트에서 Skip-gram 모델을 학습했습니다. Tensorboard를 사용하여 임베딩을 시각화했습니다. Tensorboard를 사용하면 PCA를 사용하여 데이터를 투영하기 위해...

January 16, 2018

Python과 R은 데이터 중심의 엔지니어에게 가장 인기있는 프로그래밍 언어입니다. 그러나 응용 프로그램의 나머지 부분에서 항상 빌드되는 언어는 아닙니다. 따라서 Python 또는 R로 작성된 머신러닝 모델을 .NET과 같은 언어 기반 환경에 배포 할 수있는 방법을 찾아야하는 경우가 있습니다.

이 글에서는 웹 API를 사용하여 머신러닝 모델을 .NET으로 작성된 응용 프로그램에 통합하는 방법을 보여줍니다.

Flask를 사용하여 머신러닝 예측을 공유하고 호스팅 할 수 있습니다. 

.NET 환경에 배포

.NET 환경에 배포하는 데는 여러 가지 옵션이 있으며 인프라 선택에 크게 의존합니다. 과정에 대한 아이디어를 얻기 위해 Micros...

January 16, 2018

대화 평가는 어려운 문제입니다. 특히 대화를 성공으로 잘 정의 할 수 없는 작업 중심의 대화 상자가 아닌 경우에 특히 그렇습니다. 우리는 대화형 봇이 주제에 대해 일관되고 매력적인 대화를 유지할 수 있는 능력과 봇이 처리 할 수 있는 주제의 다양성을 설명하는 토픽 기반 메트릭을 사용하여 대화 품질을 평가할 것을 제안합니다. 발화마다 대화 주제를 탐지하기 위해 DAN (Deep Average Networks)을 채택하고 여러 주제로 분류된 다양한 질문 및 쿼리 데이터에 대해 토픽 분류기를 학습합니다. 우리는 시스템이 토픽 키워드를 발화 내에서 함께 포착하고 토픽 분류를 수행 할 수 있도록 topic-word attention 테이블을...

January 1, 2018

"Skip-Thought Vector"또는 "Skip-Thoughts"는 라벨 데이터 또는 비지도학습으로 자연어 문장의 고정 길이 표현을 학습하는 간단한 신경망 모델에 부여된 이름입니다. Skip-Thoughts가 사용하는 유일한 지도/학습시그널은 자연어 코퍼스에서의 문장의 순서입니다.

고정된 표현을 사용하면 문장을 equivalent vector로 쉽게 대체할 수 있습니다. 이것은 자연어에 대한 이해, 행동 또는 반응 과정을 수학적으로 직접적으로 만듭니다. 이러한 작업의 몇가지 예는 다음과 같습니다.

-두 문장의 의미가 의미상으로 유사한지를 알려주는 작업. 
-주어진 문장이 양성인지 음수인지를 분류하는 임무.

원문
http://sany...

Please reload