머신러닝 알고리즘의 모델

Generalized Linear Models (GLM)

정규 분포(normal distribution) 이외의 오차 분포 모델(error distribution model)을 갖는 응답 변수에 대한 일반 선형 회귀(ordinary linear regression)의 유연한 일반화. GLM에는 선형, 로지스틱, 푸아송(linear, logistic, Poisson) 등 다양한 통계 모델이 있습니다.

Random Forest(DRF)

통계 샘플링 및 평균화의 강력함을 사용하고 의사 결정 트리(decision tree)를 사용하여 지도학습을 구축하는 강력한 앙상블 알고리즘(ensemble algorithm)입니다.

Gradient Boosting (GBM)

약한 예측 모델의 앙상블 형태로 예측 모델을 생성하는 방법. GBM은 단계적 방식으로 모델을 구축하고 임의로 차등화 가능한 손실 함수를 허용함으로써 일반화되며 최근 많이 이용되는 가장 강력한 방법 중 하나입니다.

K-Means (K평균)

세그멘테이션에 자주 사용되는 데이터 포인트 그룹 또는 클러스터를 찾아내는 방법입니다. 관측치를 가장 가까운 평균점을 갖는 k 점으로 군집화합니다.

Anomaly Detection (이상탐지)

데이터의 특이점을 식별하기 위해 호출하는 강력한 패턴 인식 모델 입니다.

Deep Learning (딥러닝)

비선형 변환을 계층 단위로 사용하여 데이터의 추상화를 모델링합니다. 딥러닝은 바자도학습의 한 종류이며 다른 알고리즘에서는 할 수없는 계층이 없는 데이터를 사용할 수 있습니다.

Naïve Bayes (나이브베이즈)

특정 피쳐의 값을 가정하는 확률 분류자(probabilistic classifier)는 클래스 변수(class variable)가 주어지면 다른 피쳐의 유무와 관련이 없습니다. 텍스트 분류에 자주 사용됩니다.

Hyper-Parameter Search

카테시안(Cartesian) 또는 임의의 하이퍼 파라미터 검색을 통해 유효성 검사 및 교차 유효성 검증에 대한 지원 기능을 갖춘 모델을 위한 최상의 매개 변수를 자동으로 찾습니다.