trpo.

Продвинутые RL алгоритмы: NPG, TRPO, PPO

Продолжение постов про RL:1) Intro Reinforcement Learning2) Reinforcement Learning: Model-free & Deep RL3) Reinforcement Learning: Policy gradient methods

продолжить чтение

Rambler's Top100