Добрый день!
В субботу 5 декабря Сергей Николенко (ПОМИ РАН, ВШЭ, Neuromation)
прочтёт миникурс "Обучение с подкреплением: от определений до
AlphaZero и Dactyl". Начало в 16:00.
https://compsciclub.ru/courses/rlgames/2020-autumn/
Лекция будет читаться через zoom. Ссылка для подключения будет
опубликована в новостях курса (её получат те, кто запишется на курс) и
продублирована в эту рассылку.
Аннотация курса:
Машинное обучение обычно делится на обучение с учителем и без оного.
Обучение с подкреплением -- это "третий путь", в котором обучающийся
агент взаимодействует с окружением, получая от него награды или
наказания за свои действия. Обучение с подкреплением в последние годы
производит много громких новостей: только в играх мы уже слышали об
AlphaGo, AlphaZero, MuZero, AlphaStar, OpenAI Five и многом другом, а
это только одно применение... В мини-курсе мы поговорим об основных
постановках задач в обучении с подкреплением, разберёмся, как в
обучение с подкреплением вошли глубокие нейронные сети, и постараемся
дойти до самых последних результатов.
Саша
--
Alexander V. Smal
St. Petersburg Department of Steklov Mathematical Institute
27 Fontanka, St. Petersburg, 191023, Russia