Formation M2 mathématiques des données
Semestre1
BlocOutils mathématiques pour le traitement et l'analyse des données
EnseignantsCours, TD/TP : Thanh Mai Pham Ngoc.
Crédits 4 ECTS
Horaires 15h de cours + 12h de TD + 15h de TP
ValidationContrôle continu.

Présentation

Ce cours se veut être une introduction à quelques méthodes statistiques afin de faire face aux enjeux de la grande dimension et ce autour du modèle de la régression. En effet, la difficulté du statisticien face aux données du XXIe siècle est de vaincre le fléau dit de la grande dimension. D'une part il rend les méthodes statistiques classiques inopérantes par manque de précision, d’autre part il amène à développer des approches gardant sous contrôle la complexité algorithmique des procédures d’estimation. Nous aborderons les thèmes suivants :

  • Sélection de variables (critères classiques : AIC, BIC, R2, Cp Mallows).
  • Régression sous contraintes (Ridge, Lasso).
  • Régression non-paramétrique.