Справка
STUDENT'S CONSULTANT
Электронная библиотека технического вуза
Все издания
Login/Registration
Во весь экран / Свернуть
ru
Accessibility
General Catalogue
Все издания
Menu
Искать в книге
К результату поиска
Advanced search
Bookmarks
Homepage
Login/Registration
Во весь экран / Свернуть
ru
Управление
My reports
General Catalogue
Издательства
УГС
Мои списки
Download app
Мультиагентное обучение с подкреплением
Оборот титула
Table of contents
Предисловие
Введение
Глава 1. Независимое табличное обучение
+
Глава 2. Обучение в матричных и стохастических играх
+
Глава 3. Нейросетевое обучение
-
3.1. Классификация
3.2. Модель
3.2.1. Глубокое Q-обучение
3.2.2. Децентрализованные частично наблюдаемые марковские процессы принятия решений (Dec-POMDP)
3.2.3. Двойная декомпозиция Q-значений
3.2.4. Глубокий детерминированный градиент стратегий
3.3. Алгоритмы
3.3.1. Независимое глубокое обучение с использованием полносвязной нейронной сети (IQN)
3.3.2. Централизованное обучение с использованием сверточной нейронной сети (CDQN)
3.3.3. Декомпозиция Q-значений c использованием рекуррентной нейронной сети (VDN)
3.3.4. Мультиагентный глубокий детерминированный градиент стратегий (MADDPG)
3.4. Карта
3.5. Технология
3.6. Код
3.6.1. Алгоритм IQN
3.6.2. Алгоритм VDN
3.6.3. Алгоритм MADDPG
3.7. Эксперимент
3.7.1. Алгоритм IQN
3.7.2. Алгоритм CDQN
3.7.3. Алгоритм VDN
3.7.4. Алгоритм MADDPG
3.8. Выводы
3.9. Задачи для самоконтроля
Глава 4. Эволюционное обучение
+
Глава 5. Роевое обучение
+
Заключение
Литература
+
Close Menu
Раздел
5
/
9
Страница
29
/
70
Глава 3. Нейросетевое обучение
/
/
Внимание! Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.
Для продолжения работы требуется
Registration
General Catalogue
Издательства
УГС
Мои списки
Скачать приложение
Мультиагентное обучение с подкреплением
Table of contents
Предисловие
Введение
Глава 1. Независимое табличное обучение
+
Глава 2. Обучение в матричных и стохастических играх
+
Глава 3. Нейросетевое обучение
-
3.1. Классификация
3.2. Модель
3.2.1. Глубокое Q-обучение
3.2.2. Децентрализованные частично наблюдаемые марковские процессы принятия решений (Dec-POMDP)
3.2.3. Двойная декомпозиция Q-значений
3.2.4. Глубокий детерминированный градиент стратегий
3.3. Алгоритмы
3.3.1. Независимое глубокое обучение с использованием полносвязной нейронной сети (IQN)
3.3.2. Централизованное обучение с использованием сверточной нейронной сети (CDQN)
3.3.3. Декомпозиция Q-значений c использованием рекуррентной нейронной сети (VDN)
3.3.4. Мультиагентный глубокий детерминированный градиент стратегий (MADDPG)
3.4. Карта
3.5. Технология
3.6. Код
3.6.1. Алгоритм IQN
3.6.2. Алгоритм VDN
3.6.3. Алгоритм MADDPG
3.7. Эксперимент
3.7.1. Алгоритм IQN
3.7.2. Алгоритм CDQN
3.7.3. Алгоритм VDN
3.7.4. Алгоритм MADDPG
3.8. Выводы
3.9. Задачи для самоконтроля
Глава 4. Эволюционное обучение
+
Глава 5. Роевое обучение
+
Заключение
Литература
+