© 2016 by  NEXTOBE Co.,Ltd

H2O

머신러닝 H2O 플랫폼

H2O를 사용하면 누구나 머신러닝과 예측 분석을 손쉽게 적용하여 까다로운 비즈니스 문제를 해결할 수 있습니다. 다음과 같은 현재까지는 없었던 머신러닝 플랫폼의 지능적인 기능을 제공합니다. H2O는 세계 최고의 오픈 소스 딥러닝 플랫폼입니다. H2O는 전 세계 80,000명 이상의 데이터 과학자와 9,000개 이상의 조직에서 사용하고 있습니다.

  • Best of Breed Open Source Technology - 오픈소스 기술로 구동되는 빅데이터에 대한 자유를 제공합니다. H2O는 Java로 최초부터 작성되었으며 Apache Hadoop® 및 Spark™와 같이 가장 널리 사용되는 오픈소스 제품과 완벽하게 통합되어 고객의 가장 까다로운 데이터 문제를 해결할 수 있는 유연성을 제공합니다.

  • 사용하기 쉬운 WebUI 및 익숙한 인터페이스 - H2O의 직관적인 웹 기반 Flow 그래픽 사용자 환경에서 R, Python, Java, Scala, JSON과 같은 익숙한 프로그래밍 환경과 강력한 API를 사용하여 신속하게 값을 설정하고 시작할 수 있습니다. 모델은 트레이닝 중에 시각적으로 직접 검사 할 수 있습니다.

  • 모든 일반적인 데이터베이스 및 파일 유형 지원 - Microsoft Excel, R Studio, Tableau 등에서 큰 데이터를 쉽게 탐색하고 모델링 할 수 있습니다. HDFS, S3, SQL 및 NoSQL 데이터 소스의 데이터에 연결합니다. 클라우드, 워크스테이션, 서버 또는 클러스터 어디서든 설치하고 배포할 수 있습니다.

  • 대규모 데이터 분석 - 작은 샘플뿐만 아니라 완전한 데이터 세트에 대한 모델을 트레이닝하고 H2O의 신속한 메모리 내 분산 병렬 처리 기능으로 모델을 실시간으로 개발할 수 있습니다.

  • 실시간 데이터 스코어링 - POJO(plain old Java Object) 또는 MOJO(model-optimized Java objects)를 통해 신속하게 모델을 프로덕션으로 배포합니다. 모든 환경에서 정확한 예측을 위해 모델에 대해 새로운 데이터를 평가하십시오. 다른 기술보다 빠른 스코어링과 더 뛰어난 예측을 수행합니다.

하나 이상의 노드에서 진보된 알고리즘의 힘과  오픈 소스의 자유, 빅데이터에 대한 진정한 확장성있는 메모리 처리 능력을 결합하십시오. 이러한 기능을 통해 빅데이터를 활용하여 더 빠르고,  더 쉽고, 더 비용 효율적으로 비즈니스에 최대한 이익을 주십시오.

H2O를 사용하면 더 빠르고 예측 가능한 모델링을 통해 데이터에서 얻은 통찰력을 빠르고 쉽게 얻을 수 있습니다. 기존 빅데이터 스택은 일괄 처리 됩니다. 검색 및 분석은 대화식이어야합니다. 기계를 사용하여 기계 생성 데이터를 학습하고, 더 많은 데이터가 더 나은 알고리즘을 만들어 냅니다.

H2O를 사용하면 다음을 할 수 있습니다.

  • 더 나은 예측을 합니다. H2O를 통해 정교하고 사용하기 쉬운 알고리즘 및 더 큰 데이터 세트, 더 많은 모델 및 기타 변수를 분석하는 데 필요한 처리 성능을 활용하십시오.

  • 최소한의 노력과 투자로 시작합니다. H2O는 확장 가능한 오픈 소스 플랫폼으로, 귀하의 비즈니스에서 빅데이터를 활용할 수있는 가장 실용적인 방법을 제공합니다. H2O를 사용하면 기존 언어 및 도구로 작업 할 수 있습니다. 또한 플랫폼을 Hadoop 환경으로 원활하게 확장 할 수 있습니다.

확장성 + 속도

대용량 데이터의 Fine-Grain Distributed 프로세싱으로 최대 100 배 빠른 속도.

더 빨라진 H2O는 메모리 내 처리를 사용하여 대화식으로 모델링 할 수 있으며 대규모 데이터 프로덕션 환경을 지원하는 데 필요한 병렬 분산 확장성을 제공합니다.

이 솔루션은 메모리 내 처리의 응답성을 노드와 클러스터간에 빠른 직렬화를 실행할 수있는 기능과 결합하여 대규모 데이터 세트의 크기 요구 사항을 지원할 수 있습니다. 또한 H2O는 계산 정확도의 저하없이 최적의 효율성을 가능케하는 Fine-Grain Distributed  프로세싱으로 분산 처리를 수행합니다.

메모리 내 처리 응답성

H2O를 사용하면 조직에서 고도로 최적화된 메모리 내 처리의 응답성을 활용할 수 있으므로 더 많은 모델을 운영하고 비즈니스 트랜잭션 및 상호 작용에서 실시간 인텔리전스를 확보 할 수 있습니다.

평범한 구식 Java 코드로 모델 내보내기를 사용하면 어떤 환경에서도 결과를 빨리 얻을 수 있습니다.

또한 이 솔루션을 사용하면 데이터 과학자가 더 긴 프로세스가 실행되는 동안 부분 쿼리 결과를 볼 수 있으므로 중단해야 하는 작업을 즉시 발견하고 최적의 방법을 찾기 위해 더 빠르게 반복 할 수 있습니다.