Master 2: parcours Mathématiques des données
Ce parcours de Master 2 ouvrira en septembre 2020.
But de la formation
Le but du parcours de master 2 est de former des étudiants:
- qui maîtrisent tous les principaux outils mathématiques qui interviennent en sciences des données (arithmétique pour la cryptographie, statistiques pour l’extraction d’information, ondelettes pour le traitement des sons et des images, etc.),
- capables de proposer à leur futurs employeurs des solutions adaptées à leurs problématiques de sécurité, d’analyse, et d’exploitation de leurs données,
- d’expliquer l’intérêt, le fonctionnement et les limites de ces solutions, et d’organiser leur déploiement.
Une culture couvrant tous les aspects mathématiques des sciences des données permettra de s’adapter aux évolutions futures d’un domaine dont l’étendue et l’importance ne cesse de croître. Ces compétences sont très recherchées sur le marché du travail.
Organisation de la formation
L’année comporte 24 semaines de cours de début septembre à fin mars, suivies d’un stage de 4 mois en entreprise ou organisme de recherche de début avril à fin juillet. Les cours et travaux pratiques sont organisés en une dizaine de modules de mathématiques et trois modules d’informatique.
Les modules de mathématiques sont organisés en trois blocs.
- Le premier bloc concerne la sécurité des données. Le plat de résistance est un cours sur les techniques modernes des cryptographie basées sur les courbes elliptiques. On y adjoint plusieurs petits cours d’introduction à des domaines annexes: preuves de sûreté des méthodes de codage, codes correcteurs d’erreurs géométriques, et blockchains qui constituent un outil important de tracabilité des chaînes de données.
- Le second bloc de cours introduit les étudiants aux principaux outils mathématiques d’analyse des données, des différentes techniques d’apprentissage statistique (régressions, arbres de décision, réseaux neuronaux, machines à vecteurs de support,...), aux outils modernes d’analyse et de traitement du signal (théorie des ondelettes), en passant par l’analyse topologique des données, sujet en plein développement basé notamment sur la théorie de l’homologie persistante.
- Enfin, le troisième bloc de cours présente des grands champs d’applications de l’analyse des données, et des problèmes inhérents à certains types de données. Les étudiants ont ainsi la possibilité de suivre des cours sur les bio-statistiques et le traitement des données médicales (où des problèmes spécifiques proviennent par exemples des donnés censurées) ou sur le traitement des images (qui mêlent des outils mathématiques de nature statistique, géométrique, etc.).
En complément de ces modules de mathématiques, les étudiants bénéficient de modules d’informatiques de Conception de bases de données et de Visualisation des données.
Tous les cours sont accompagnés de séances d’exercices et de travaux pratiques sur machine permettant de d’assimiler et d’implémenter les notions et algortihmes vus en cours. L’évaluation se fait via des examens écrits ou sur machine, mais aussi au travers de mini-projets et d’exposés qui permettent au étudiants d’entrevoir des techniques ou des problèmes plus spécifiques et d’accroître leur autonomie.
D’avril à juillet, les étudiants mettent en œuvre les outils et les techniques acquises tout au long depuis le début du master grâce à un stage en entreprise ou en organisme de recherche. Ce stage, qui leur permet de se confronter à des problématique concrètes, est une composante importante du master 2.
Débouchés de la formation
Les sciences des données sont un domaine en pleine explosion, qui s’appuie sur des outils mathématiques et informatiques. Les compétences acquises par les étudiants du master leur permettront de travailler sur des problématiques liées aussi bien à la sécurité, qu’au traitement, ou à l’analyse et l’exploitation des données. Ils seront amener à exercer des fonctions de:
- mise en œuvre et utilisation de solutions logicielles (data scientist),
- coordination de projets (chef de projet, ingénieur en recherche et développement)
- conseil aux entreprises concernant ces problématiques (consultant en Data Science).
Ils pourront exercer ces fonctions:
- dans une entreprise généraliste dont l’activité (banque, assurance, bio-médical, marketing, e-commerce,...) pose des problèmatiques importantes de sécurité, traitement, analyse ou exploitation des données,
- ou dans une société spécialisée (start-up, SSII, société de conseil) qui propose des solutions logicielles et/ou prestations de conseil concernant ces problématiques.
Liste des modules
Environnement et outils informatiques
Conception de bases de données (20h de cours, 24h de travaux pratiques, 5 ECTS, cours du master informatique)
Visualisation des données (6h de cours + mini-projet, 1,5 ECTS, cours commun avec la MACS)
Sécurité des données
Courbes elliptiques et applications à la cryptographie (20h de cours, 20h de travaux dirigés et pratiques, 5 ECTS)
Preuves de sûreté (6h de cours, 6h de travaux pratiques, 1,5 ECTS)
Codes correcteurs d’erreurs géométriques (6h de cours, 6h de travaux pratiques, 1,5 ECTS)
Blockchains (6h de cours, 6h de travaux pratiques, 1,5 ECTS)
Analyse des données et extraction d’information
Apprentissage statistique (20h de cours, 20h de travaux pratiques, 4 ECTS, cours du master EiD2)
Réseaux de neurones et deep learning (14h de cours, 14h de travaux pratiques, 4 ECTS, cours du master EiD2)
Théorie du signal et ondelettes (20h de cours, 20h de travaux dirigés et pratiques, 5 ECTS)
Analyse topologique des données et homologie persistante (20h de cours, 20h de travaux pratiques, 5 ECTS)
Problèmes spécifiques liés à certains types de données
Bio-statistiques et données médicales (20h de cours, 20h de travaux pratiques, 5 ECTS)
Outils pour le traitement et l’analyse des images (20h de cours, 20h de travaux pratiques, 5 ECTS)
Stage d’application
Stage en entreprise ou organisme de recherche (4 mois à temps plein, de début avril à fin juillet, 18 ECTS)