TensorFlow로 부정거래 예측하기

이 분석의 목표는 거래 데이터에서 신용 카드 사기를 예측하는 것입니다. 이 분석에서 tensorflow를 사용하여 예측 모델을 작성하고 t-SNE를 사용하여 데이터 세트를 2 차원으로 시각화합니다. 데이터에 대한 자세한 내용을 보려면 https://www.kaggle.com/dalpozz/creditcardfraud를 방문하십시오.

이 분석의 섹션은 다음과 같습니다.

  1. 데이터 탐색

  2. 신경망 구축

  3. t-SNE로 데이터 시각화.

구현 상세 과정

 

 

‘Time’ 피처는 두 유형의 트랜잭션에서 매우 유사하게 보입니다. 사기적 거래가 보다 균등하게 분배되고 일반 거래가 주기적으로 분배된다고 주장 할 수 있습니다. 이렇게하면 ‘오프 피크’ 시간에 사기 거래를 쉽게 감지 할 수 있습니다.

t-SNE로 데이터 시각화하기

먼저 t-SNE을 원본 데이터와 함께 사용하고 신경망을 훈련하기 위해 사용한 데이터를 사용합니다. 나는 두번째 산점도가 정상 거래와 사기 거래 간의 명확한 대조를 보일 것으로 기대합니다. 이 경우 분석의 기능 엔지니어링 단계에서 수행한 작업이 신경망에서 데이터를 이해하는 데 도움이된다는 신호가 나타납니다.

 

 

 

이 두가지 주요 그룹은 사기 거래로, 나머지는 나머지 데이터와 혼합되어 있습니다.

참고 : 이 시각화를 위해 284,315개의 일반 트랜잭션 중 10,000개만 사용했습니다. 나는 더 많은 것을 사용하는 것을 원했지만, 10,000건이 넘는 트랜잭션이 포함되면 노트북이 망가질 것입니다. 사용되는 데이터의 3.15 %만으로도 이 플롯에는 어느 정도의 정확성이 있어야 하지만, 모든 트랜잭션이 포함 된 경우 레이아웃이 다르게 보일 것이라고 확신합니다.

 

 

이 분석의 기능 엔지니어링 단계에서 수행한 작업은 최상의 작업이었습니다. 사기 거래는 모두 일련의 포인트 중 하나임을 알 수 있습니다. 이는 모델이 테스트 데이터의 사기 거래를 식별하고 교육 데이터에서 사기 거래의 특징을 파악하는 것이 더 쉽다는 것을 나타냅니다.

원본 : https://www.kaggle.com/currie32/predicting-fraud-with-tensorflow