trpo.
Продвинутые RL алгоритмы: NPG, TRPO, PPO
Продолжение постов про RL:1) Intro Reinforcement Learning2) Reinforcement Learning: Model-free & Deep RL3) Reinforcement Learning: Policy gradient methods
Творчество и интуиция. Реабилитация мозга
Символическое и допонятийное мышление
Вегетативная (автономная) нервная система
Структура поведенческого акта. Функциональная система П.К.Анохина
Продолжение постов про RL:1) Intro Reinforcement Learning2) Reinforcement Learning: Model-free & Deep RL3) Reinforcement Learning: Policy gradient methods