Article Dans Une Revue
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle
Année : 2006
Résumé
This article focusses on the automated synthesis of agents in an uncertain environment, working in the setting of Reinforcement Learning, and more precisely of Partially Observable Markov Decision Processes. The agents (with no model of their environment and no short-term memory) are facing multiple motivations/goals simultaneously, a problem related to the field of Action Selection. We propose and evaluate various Action Selection architectures. They all combine already known basic behaviors in an adaptive manner, by learning the tuning of the combination, so as to maximize the agent's payoff. %This work opens the way to a second step in which the basic behaviors themselves will be selected and designed in an automated manner. The logical continuation of this work is to automate the selection and design of the basic behaviors themselves.
Origine | Fichiers produits par l'(les) auteur(s) |
---|
Loading...
Alain Dutech : Connectez-vous pour contacter le contributeur
https://inria.hal.science/inria-00119272
Soumis le : vendredi 8 décembre 2006-14:16:45
Dernière modification le : jeudi 15 février 2024-03:30:51
Archivage à long terme le : mardi 6 avril 2010-20:42:17
Dates et versions
- HAL Id : inria-00119272 , version 1
Citer
Olivier Buffet, Alain Dutech, François Charpillet. Etude de différentes combinaisons de comportements adaptatives.. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2006, Décision et planification dans l'incertain, 20 (2-3), pp.311-344. ⟨inria-00119272⟩
Collections
206
Consultations
235
Téléchargements