L’objectif principal du cours est de présenter les  principales méthodes d’estimation non-paramétriques. En particulier le cours développera les problèmes d’estimation non paramétrique de la fonction de répartition, de la fonction quantile, de la fonction de survie. Nous verrons également le problème d’estimation de la densité. et de l’estimation d’une  fonction de régression en particulier par la méthode des noyaux et de projection. Cela nous donnera l’occasion de mettre l’accent sur le compromis biais/variance au travers du problème du choix d’une fenêtre optimale par validation croisée.

Le cours de Fouille de Données est un cours d'introduction à l'apprentissage supervisé par la pratique.
Il est basé sur le langage python et vise à rendre les étudiants autonomes dans les environnements scikit-learn et keras / tensorflow.

Objectifs :

  • Maitriser les bases théoriques de l'apprentissage supervisé en général
  • Connaître en détail quelques algorithmes clés (arbres de décision, forêts aléatoires, SVM, méthodes pénalisées type Lasso).
  • Introduction avancée aux réseaux de neurones (perceptrons multi-couches et réseaux convolutifs)
  • Savoir mettre en œuvre ces algorithmes en python (via notamment les package scikit-learn et keras / tensorflow).

Format du cours :

  • 8 séances de 3h – 1h à 1h30 de cours théorique, 1h30 à 2h de TP sur machine.
  • Evaluation : TP noté à mi-parcours + « data challenge » et  « quizz » d'évaluation des connaissances au terme du cours

This course is designed as a support for the English lessons in M2 SSD