Справка
ЭБС "КОНСУЛЬТАНТ СТУДЕНТА"
Электронная библиотека технического вуза
Все издания
Вход / регистрация
Во весь экран / Свернуть
en
Версия для слабовидящих
Каталог
Все издания
Меню
Искать в книге
К результату поиска
Расширенный поиск
Закладки
На главную
Вход / регистрация
Во весь экран / Свернуть
en
Управление
Мои отчеты
Каталог
Издательства
УГС
Мои списки
Скачать приложение
Мультиагентное обучение с подкреплением
Оборот титула
Оглавление
Предисловие
Введение
Глава 1. Независимое табличное обучение
+
Глава 2. Обучение в матричных и стохастических играх
+
Глава 3. Нейросетевое обучение
-
3.1. Классификация
3.2. Модель
3.2.1. Глубокое Q-обучение
3.2.2. Децентрализованные частично наблюдаемые марковские процессы принятия решений (Dec-POMDP)
3.2.3. Двойная декомпозиция Q-значений
3.2.4. Глубокий детерминированный градиент стратегий
3.3. Алгоритмы
3.3.1. Независимое глубокое обучение с использованием полносвязной нейронной сети (IQN)
3.3.2. Централизованное обучение с использованием сверточной нейронной сети (CDQN)
3.3.3. Декомпозиция Q-значений c использованием рекуррентной нейронной сети (VDN)
3.3.4. Мультиагентный глубокий детерминированный градиент стратегий (MADDPG)
3.4. Карта
3.5. Технология
3.6. Код
3.6.1. Алгоритм IQN
3.6.2. Алгоритм VDN
3.6.3. Алгоритм MADDPG
3.7. Эксперимент
3.7.1. Алгоритм IQN
3.7.2. Алгоритм CDQN
3.7.3. Алгоритм VDN
3.7.4. Алгоритм MADDPG
3.8. Выводы
3.9. Задачи для самоконтроля
Глава 4. Эволюционное обучение
+
Глава 5. Роевое обучение
+
Заключение
Литература
+
Close Menu
Раздел
5
/
9
Страница
1
/
70
Глава 3. Нейросетевое обучение
/
/
Внимание! Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.
Для продолжения работы требуется
Регистрация
Каталог
Издательства
УГС
Мои списки
Скачать приложение
Мультиагентное обучение с подкреплением
Оглавление
Предисловие
Введение
Глава 1. Независимое табличное обучение
+
Глава 2. Обучение в матричных и стохастических играх
+
Глава 3. Нейросетевое обучение
-
3.1. Классификация
3.2. Модель
3.2.1. Глубокое Q-обучение
3.2.2. Децентрализованные частично наблюдаемые марковские процессы принятия решений (Dec-POMDP)
3.2.3. Двойная декомпозиция Q-значений
3.2.4. Глубокий детерминированный градиент стратегий
3.3. Алгоритмы
3.3.1. Независимое глубокое обучение с использованием полносвязной нейронной сети (IQN)
3.3.2. Централизованное обучение с использованием сверточной нейронной сети (CDQN)
3.3.3. Декомпозиция Q-значений c использованием рекуррентной нейронной сети (VDN)
3.3.4. Мультиагентный глубокий детерминированный градиент стратегий (MADDPG)
3.4. Карта
3.5. Технология
3.6. Код
3.6.1. Алгоритм IQN
3.6.2. Алгоритм VDN
3.6.3. Алгоритм MADDPG
3.7. Эксперимент
3.7.1. Алгоритм IQN
3.7.2. Алгоритм CDQN
3.7.3. Алгоритм VDN
3.7.4. Алгоритм MADDPG
3.8. Выводы
3.9. Задачи для самоконтроля
Глава 4. Эволюционное обучение
+
Глава 5. Роевое обучение
+
Заключение
Литература
+