[Перевод] Обучение с подкреплением: практические рекомендации по обучению сетей Deep Q В предыдущем материале…

[Перевод] Обучение с подкреплением: практические рекомендации по обучению сетей Deep Q В предыдущем материале из этой серии мы рассказали о сетях Deep Q (Deep Q Network, DQN) и написали алгоритм их обучения на псевдокоде. Хотя такие сети, в принципе, работоспособны, практическая реализация алгоритмов обучения с подкреплением (Reinforcement Learning, RL), выполняемая без понимания их ограничений, может вести к нестабильности создаваемых систем и к плохим результатам обучения. В этом ... https://clck.ru/reUzr

Автор: Habr все новости об IT