Options d’inscription

Les méthodes numériques sont un ensemble de techniques mathématiques utilisées pour résoudre des problèmes numériques, souvent lorsque les solutions exactes ne sont pas accessibles analytiquement. Elles sont largement utilisées en ingénierie, en physique, en informatique, et dans de nombreux autres domaines scientifiques.
Ce cours montre l'usage de méthodes numériques en Intelligence Artificielle en présentant les fondements théoriques et pratiques de l'apprentissage par renforcement. Cette technique repose sur des modélisations mathématiques comme les processus de décision de Markov (MDP), les équations de Bellman, et les méthodes d’optimisation. L'application des méthodes numérique en apprentissage par renforcement se décline via la résolution d’équations (e.g. les itérations successives dans Q-Learning ou les méthodes de gradient utilisées dans Policy Gradient) et au travers d'approches d'optimisation (e.g. les algorithmes comme Deep Q-Learning ou Actor-Critic).

   

Les visiteurs anonymes ne peuvent pas accéder à ce cours. Veuillez vous connecter.