Неопределенность результата действия в парадигме Reinforcement Learning

Крылов Андрей Константинович
Интегрированные модели и мягкие вычисления в искусственном интеллекте.

ТИП ПУБЛИКАЦИИ статья в сборнике трудов конференции

ГОД 2005

ЯЗЫК RU

ЦИТИРОВАНИЙ 4

АННОТАЦИЯ

Рассматривается содержание понятия «результат» (действия) в парадигме Reinforcement Learning, его экспериментальные оценки и возможность сопоставления с понятием «результат» в системной парадигме. Показана неоднозначность и нечеткость результатов действий в тестовой задаче, с которой модель, работающая в данной парадигме, тем не менее, успешно справляется. Рассмотрена значимость и возможность бинарной дефаззификации успешности действий по принципу «достижения» - «не достижения» цели. Для выяснения роли прогнозирования результата действия, выдвинута гипотеза о необходимости усложнения тестовой задачи и приближения ее к реальным биологическим задачам, всегда требующим прогнозирования результатов действий.

ЦИТАТА

Крылов, А.К. Неопределенность результата действия в парадигме Reinforcement Learning / А.К. Крылов. В сборнике: Интегрированные модели и мягкие вычисления в искусственном интеллекте. – 2005. – С. 238-243

АВТОРЫ

Крылов Андрей Константинович

ЛАБОРАТОРИЯ ПСИХОФИЗИОЛОГИИ имени В. Б. Швыркова
Старший научный сотрудник

Публикаций в поиске

ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ ИНДИВИДУАЛЬНЫЙ ОПЫТ НАУЧЕНИЕ

ПОХОЖИЕ ПУБЛИКАЦИИ

2004 год

Вероятностный анализ "восприятия" модельным роботом тестовой поведенческой задачи фуражирования Крылов Андрей Константинович

Тестовая поведенческая задача фуражирования описана с точки зрения самого агента в соответствии с методологией Reinforcement Learning. Показано, что фактическая задача варьирует в зависимости от морфо...

2004 год

Оценка применимости рефлекторной модели нейронной сети к поведенческой задаче Крылов Андрей Константинович

Используемые в нейроинформатике представления о работе мозга основаны на рефлекторной теории, что позволяет ей успешно справляться с математическими и физическими задачами. В работе проведен анализ пр...

2005 год

Тестовая поведенческая задача минимально необходимой сложности: скрытая динамика Крылов Андрей Константинович

Выдвинуты критерии к минимально сложной тестовой поведенческой задаче. На их основе обоснована задача фуражирования. Проведен анализ этой задачи с точки зрения модели мобильного робота, погруженного ...