Неопределенность результата действия в парадигме Reinforcement Learning | Библиотека Института психологии РАН

Библиотека Института психологии РАН

Неопределенность результата действия в парадигме Reinforcement Learning

Крылов Андрей Константинович
Интегрированные модели и мягкие вычисления в искусственном интеллекте.
ТИП ПУБЛИКАЦИИ статья в сборнике трудов конференции
ГОД 2005
ЯЗЫК RU
ЦИТИРОВАНИЙ 4
АННОТАЦИЯ
Рассматривается содержание понятия «результат» (действия) в парадигме Reinforcement Learning, его экспериментальные оценки и возможность сопоставления с понятием «результат» в системной парадигме. Показана неоднозначность и нечеткость результатов действий в тестовой задаче, с которой модель, работающая в данной парадигме, тем не менее, успешно справляется. Рассмотрена значимость и возможность бинарной дефаззификации успешности действий по принципу «достижения» - «не достижения» цели. Для выяснения роли прогнозирования результата действия, выдвинута гипотеза о необходимости усложнения тестовой задачи и приближения ее к реальным биологическим задачам, всегда требующим прогнозирования результатов действий.
ЦИТАТА
Крылов, А.К. Неопределенность результата действия в парадигме Reinforcement Learning / А.К. Крылов. В сборнике: Интегрированные модели и мягкие вычисления в искусственном интеллекте. – 2005. – С. 238-243
АВТОРЫ

Крылов Андрей Константинович

ЛАБОРАТОРИЯ ПСИХОФИЗИОЛОГИИ имени В. Б. Швыркова
Старший научный сотрудник

Публикаций в поиске

66
ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ НАУЧЕНИЕ ИНДИВИДУАЛЬНЫЙ ОПЫТ
ПОХОЖИЕ ПУБЛИКАЦИИ
2004 год

2004 год

2005 год