딥러닝을 통한 이미지 배경 제거

배경 제거는 일종의 “마커 “및 가장자리 감지를 사용하는 경우 수동 또는 반수동으로 쉽게 수행 할 수 있는 작업입니다. (Photoshop, Power Point 조차도 이와 같은 도구가 있습니다) 그러나 완전히 자동화된 배경 제거는 상당히 까다로운 작업이며, 우리가 아는 한 일부는 시도 했었지만 만족스러운 결과를 가진 제품은 아직 없습니다.

어떤 배경을 제거 할 것인가? 이 모델은 물체, 각도 등의 측면에서 모델이 더 구체적일수록 분리가 더 높은 품질을 갖기 때문에 중요한 질문이었습니다. 작업을 시작할 때 우리는 다음을 생각했습니다 : 모든 유형의 이미지에서 전경과 배경을 자동으로 식별하는 일반 배경 제거 도구. 그러나 첫 번째 모델을 학습한 후에는 특정 이미지세트에 노력을 집중하는 것이 더 낫다고 생각했습니다. 그래서 셀카와 인간의 초상화에 초점을 맞추기로 결정했습니다.

셀카는 눈에 띄는 집중된 전경(하나 이상의 “인물”)을 가진 이미지로, 객체(얼굴 + 상체)와 배경 사이의 좋은 분리를 보장하며, 일정한 각도와 항상 동일한 객체인 사람이 있습니다.

 

 

시맨틱 세분화(Semantic Segmentation)
유사한 딥러닝과 컴퓨터비전 작업을 검토 할 때 최선의 선택이 의미론적 세분화 작업 이라는 것을 쉽게 알 수 있습니다.
Depth of Detection에 의한 분리와 같은 다른 전략도 존재하지만, 우리의 목적을 위해서는 충분히 성숙한 것처럼 보이지 않았습니다.

몇가지 조사를 한 후에 우리는 FCN, Unet, Tiramisu 라는 세 가지 모델을 사용했습니다. 이는 매우 깊은 인코더-디코더 아키텍처입니다. 우리는 mask-RCNN에 대한 의견을 갖고 있었지만 구현은 프로젝트 범위를 벗어난 것처럼 보였습니다.

FCN은 그 결과가 원했던 것 만큼 좋지 않았기 때문에 관련이 없는 것처럼 보였습니다.하지만 언급한 다른 두 모델은 CamVid 데이터 세트의 Tiramisu과 Unet의 큰 장점은 소형과 속도입니다. 구현 측면에서 Unet은 구현하기에 매우 간단하며(keras를 사용함), Tiramisu도 구현 가능했습니다.

 

 

Tags:

딥러닝

배경제거

FCN

Unet

RCNN

Sementic

segmentation

Tiramisu

Keras

DenseNet