🎓 L1 - Sciences des données
Présentation
Le cours se scinde en deux parties principales : la première porte sur l’analyse descriptive d’un jeu de données et la seconde sur l’inférence (c’est-à-dire la généralisation) qui peut être menée à partir d’un ensemble d’observations. Une initiation à l’optimisation numérique sépare ces deux parties. Chaque partie est composée de rappels de notions au programme de la classe de Terminale, suivi de l’introduction de méthodes nouvelles. Les objectifs et les propriétés de chaque méthode sont introduits formellement avant d’être utilisés en pratique sur machine.
La partie pratique sur machine utilise un langage largement répandu en informatique et en sciences des données : Python avec les bibliothèques NumPy et Matplotlib. Sur des jeux de données réels, les séances pratiques permettront par exemple de faire de la reconnaissance de caractères manuscrits, de la prévision d’occupation de stations Vélib ou encore de la détection automatique de spams.
Charge
- Responsabilité du cours (300 étudiant·e·s ; 18 chargé·e·s de TD/TP)
- 1 Cours magistral (22hCM ; 150 étudiant·e·s)
- 1 groupe de TD/TP (38,5hTD ; 30 étudiant·e·s)