Zusammenfassung
Das automatische Erlernen von Motorfähigkeiten würde es einem autonomen Roboter ermöglichen, sich an neuartige Situationen anzupassen. Dieses Ziel ist seit langem eine Vision der Robotik, Künstlichen Intelligenz und Kognitionswissenschaft. Allerdings kann dieses Vorhaben mit heutigen Techniken nicht erreicht werden, da nur wenige der Methoden in der Lage sind, mit der Komplexität moderner Manipulatoren oder von humanoiden Robotern umzugehen. Dieser Artikel beschreibt allgemeine Ansätze für textslPolicy Learning mit einem Schwerpunkt auf Motorstrategien. Das Ziel ist es, die Grundlagen zu schaffen, um motorische Fähigkeiten zu erlernen und sich selber automatisch zu verbessern. Hierfür werden zwei bedeutende Bereiche für einen solchen Ansatz betrachtet: einerseits Policy-Learning-Algorithmen, die den Anforderungen des Erwerbens motorischer Fähigkeiten gerecht werden, andererseits theoretisch fundierte, allgemeine Strukturen, welche für Aufgabendarstellung und -ausführung benötigt werden.
Abstract
Robot learning methods which allow autonomous robots to adapt to novel situations have been a long standing vision of robotics, artificial intelligence, and cognitive sciences. However, to date, learning techniques have yet to fulfill this promise as only few methods manage to scale into the high-dimensional domains of manipulator robotics, or even the new upcoming trend of humanoid robotics. If possible, scaling was usually only achieved in precisely pre-structured domains. In this paper, we investigate the ingredients for a general approach policy learning with the goal of an application to motor skill refinement in order to get one step closer towards human-like performance. For doing so, we study two major components for such an approach, i. e., firstly, we study policy learning algorithms which can be applied in the general setting of motor skill learning, and, secondly, we study a theoretically well-founded general approach to representing the required control structures for task representation and execution.
© by Oldenbourg Wissenschaftsverlag, Tübingen, Germany