Справка
x
STUDENT'S CONSULTANT
Электронная библиотека технического вуза
Все издания
Login/Registration
Во весь экран / Свернуть
ru
Accessibility
General Catalogue
Все издания
Menu
Искать в книге
К результату поиска
Advanced search
Bookmarks
Homepage
Login/Registration
Во весь экран / Свернуть
ru
Управление
My reports
General Catalogue
Издательства
УГС
Мои списки
Download app
Обучение с подкреплением на PyTorch: сборник рецептов
Оборот титула
Table of contents
Об авторе
О рецензентах
Предисловие
Глава 1. Приступаем к обучению с подкреплением и PyTorch
Глава 2. Марковские процессы принятия решений и динамическое программирование
Глава 3. Применение методов Монте-Карло для численного оценивания
Глава 4. TD-обучение и Q-обучение
Глава 5. Решение задачи о многоруком бандите
Глава 6. Масштабирование с помощью аппроксимации функций
Глава 7. Глубокие Q-сети в действии
Глава 8. Реализация методов градиента стратегии и оптимизация стратегии
Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird
Предметный указатель
Close Menu
Раздел
5
/
13
Страница
1
/
34
Глава 2. Марковские процессы принятия решений и динамическое программирование
/
/
Внимание! Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.
Для продолжения работы требуется
Registration
General Catalogue
Издательства
УГС
Мои списки
Скачать приложение
Обучение с подкреплением на PyTorch: сборник рецептов
Table of contents
Об авторе
О рецензентах
Предисловие
Глава 1. Приступаем к обучению с подкреплением и PyTorch
Глава 2. Марковские процессы принятия решений и динамическое программирование
Глава 3. Применение методов Монте-Карло для численного оценивания
Глава 4. TD-обучение и Q-обучение
Глава 5. Решение задачи о многоруком бандите
Глава 6. Масштабирование с помощью аппроксимации функций
Глава 7. Глубокие Q-сети в действии
Глава 8. Реализация методов градиента стратегии и оптимизация стратегии
Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird
Предметный указатель