TensorFlow Agent

이 프로젝트는 강화학습을위한 최적화된 인프라를 제공합니다. OpenAI gym 인터페이스를 병렬 환경으로 확장하여 에이전트를 TensorFlow에 구현하고 배치를 수행할 수 있습니다. 출발점으로 Proximal Policy Optimization의 최적화된 구현인 BatchPPO를 제공합니다.

 

 

논문
https://drive.google.com/…/0B20Yn-GSaVHGMVlPanRTRlNIRlk/view

깃허브
https://github.com/tensorflow/agents

Tags:

TensorFlow Agent

OpenAI

강화학습

BatchPPO

TensorFlow

Proximal

Policy