Publication

Kernel methods and Model predictive approaches for Learning and Control

Sanket Sanjay Diwale
2019
Thèse EPFL
Résumé

Data-driven modeling and feedback control play a vital role in several application areas ranging from robotics, control theory, manufacturing to management of assets, financial portfolios and supply chains. Many such problems in one way or another are related to variational problems in optimal control and machine learning.

The following work first presents, a generalized representer theorem approach to solving such variational problems when closed, densely defined operators, like the differential operators, are involved. Furthermore, loss functionals on infinite dimensional Hilbert spaces are considered to allow for greater freedom in problem formulations. The statement of the theorem presents a necessary and sufficient condition for the existence of linear representer for optimal solutions of such problems. Finally, examples, applying the theorem to neural networks, stochastic regression, and sparsity-inducing regularization problems are presented.

The second part of the thesis deals with applications of variational optimization in control problems. Examples from optimal control and model predictive control are presented for applications in the domain of autonomous vehicles and airborne wind energy systems. First, a combination of manifold learning and model predictive control is presented for obstacle avoidance in autonomous driving. Manifold learning is presented as a means to describe boundaries of star-shaped sets for which a single inequality constraint is sufficient to check containment of a point in the set's interior. The approach presented, learns the largest star-shaped set within a circular range such that all obstacle points remain outside the set. The inequality condition for checking containment in such sets is incorporated into a multi-phase, free-end-time optimal control problem to plan trajectories and control inputs moving the vehicle from one point to another while remaining within a given collection of star-shaped sets. The multi-phase, free-end-time problem is adapted to a moving horizon form to give a model predictive path following controller that avoids obstacles by virtue of the manifold learning scheme. A real-time, dynamically updated manifold is learned using point cloud data from a lidar-like sensor on the vehicle to avoid any apriori unknown or moving obstacles. Convergence and recursive feasibility guarantees for the MPC scheme are provided under mild assumptions on the behavior of the obstacles and dynamics of the vehicle. An automated parking scenario in the presence of static and dynamic obstacles is demonstrated in simulation for the complete process of optimal trajectory planning and path following.

Next, a continuous time, path following model predictive control scheme is shown for an Airborne Wind Energy (AWE) system. Here stability and convergence guarantees are provided by combining the model predictive controller with terminal constraints inspired from a convergent vector field design problem. A formal stability proof relying on Lyapunov stability arguments is presented to show that for such a design of vector field terminal constraints the path following controller converges to a zero tracking error on the desired path.

The last part of the thesis deals with uncertainty in AWE systems due to wind conditions and unknown aerodynamic characteristics. A Gaussian process data-driven optimisation technique and a direct adaptive nonlinear controller design are presented for the same.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Concepts associés (40)
Commande prédictive
La commande prédictive (ou compensation ou correction anticipatrice) est une technique de commande avancée de l’automatique. Elle a pour objectif de commander des systèmes industriels complexes. Le principe de cette technique est d'utiliser un modèle dynamique du processus à l'intérieur du contrôleur en temps réel afin d'anticiper le futur comportement du procédé. La commande prédictive fait partie des techniques de contrôle à modèle interne (IMC: Internal Model Controler).
Théorie du contrôle
En mathématiques et en sciences de l'ingénieur, la théorie du contrôle a comme objet l'étude du comportement de systèmes dynamiques paramétrés en fonction des trajectoires de leurs paramètres. On se place dans un ensemble, l'espace d'état sur lequel on définit une dynamique, c'est-à-dire une loi mathématiques caractérisant l'évolution de variables (dites variables d'état) au sein de cet ensemble. Le déroulement du temps est modélisé par un entier .
Commande optimale
La théorie de la commande optimale permet de déterminer la commande d'un système qui minimise (ou maximise) un critère de performance, éventuellement sous des contraintes pouvant porter sur la commande ou sur l'état du système. Cette théorie est une généralisation du calcul des variations. Elle comporte deux volets : le principe du maximum (ou du minimum, suivant la manière dont on définit l'hamiltonien) dû à Lev Pontriaguine et à ses collaborateurs de l'institut de mathématiques Steklov , et l'équation de Hamilton-Jacobi-Bellman, généralisation de l'équation de Hamilton-Jacobi, et conséquence directe de la programmation dynamique initiée aux États-Unis par Richard Bellman.
Afficher plus
Publications associées (250)

Learning and optimization of anticipatory feedback controllers for robot manipulation

Hakan Girgin

Programming intelligent robots requires robust controllers that can achieve desired tasks while adapting to the changes in the task and the environment. In this thesis, we address the challenges in designing such adaptive and anticipatory feedback controll ...
EPFL2023

Data-driven Methods for Control: from Linear to Lifting

Yingzhao Lian

The progress towards intelligent systems and digitalization relies heavily on the use of automation technology. However, the growing diversity of control objects presents significant challenges for traditional control approaches, as they are highly depende ...
EPFL2023

Training Efficient Controllers via Analytic Policy Gradient

Dario Floreano, Valentin Wüest, Davide Scaramuzza

Control design for robotic systems is complex and often requires solving an optimization to follow a trajectory accurately. Online optimization approaches like Model Predictive Control (MPC) have been shown to achieve great tracking performance, but requir ...
2023
Afficher plus
MOOCs associés (32)
Introduction to optimization on smooth manifolds: first order methods
Learn to optimize on smooth, nonlinear spaces: Join us to build your foundations (starting at "what is a manifold?") and confidently implement your first algorithm (Riemannian gradient descent).
Algèbre Linéaire (Partie 1)
Un MOOC francophone d'algèbre linéaire accessible à tous, enseigné de manière rigoureuse et ne nécessitant aucun prérequis.
Algèbre Linéaire (Partie 1)
Un MOOC francophone d'algèbre linéaire accessible à tous, enseigné de manière rigoureuse et ne nécessitant aucun prérequis.
Afficher plus

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.