Introduction à la science des données - L1 Sciences
Résumé de section
-
Le contenu du cours est accessible à tous sans inscription sous une license [ CC-BY-SA ]. Pour accéder aux tests et recevoir des notes il faut cependant être inscrit au cours.
[AMPHIS: les MERCREDIS de 8h15 à 9h15 dans votre salle virtuelle usuelle ]
- MARS 10
- MARS 24
- MARS 31
- AVRIL 7
- AVRIL 14
- AVRIL 21
- MAI 5
- MAI 12
- MAI 19
Je m'appelle Isabelle Guyon ( voir ma page web ). Je suis prof depuis 2015 à Paris-Saclay. On m'a fait venir pour essayer de communiquer le virus du "machine learning" et de la science des données (qui occupent une part grandissante des techniques d'Intelligence Artificielle).
J'ai créé ce cours de L1 l'an dernier avec Nicolas Thiéry { voir version de 2019/2020 ). A partir de 2020/2021, ce cours est obligatoire en L1 MI et le cours de L2 info est ramené à 9 semaines, car certaines bases de sciences des données et de Python sont désormais couvertes en L1 (il y a maintenant aussi un cours de programmation Python en S1).
Ce cours de L1 a un socle pratique important (1h de cours et 2h de TP, pendant 9 semaines). Il est agencé de façon à donner un aperçu complet de la chaîne de traitement d'un problème de sciences des données, tout en introduisant des concepts de statistique et de vision par ordinateur de base. La progression du cours (version 2020/2021) est la suivante:
Première partie:
-
1.
Introduction et statistiques de base
(moyenne, médiane, quartiles, histogrammes) [DIAPOS]
Sujet de TP et devoirs à la maison - 2. Exemple de chaîne complète de traitement (mini-problème de classification d'images de fruits simplifié, méthodes des plus proches voisins, training/test set, taux de succès, barres d'erreur) [DIAPOS]
- 3. Explorations, visualisations, et fins des rappels de stats [DIAPOS]
-
4.
Représentation des donnée
(extraction de features, selection de features) [DIAPOS]
- 5. Classifieurs (linéaires, plus proches voisins, arbres de décision, etc.) [DIAPOS]
Deuxième partie:
-
6.
Vision par ordinateur
[DIAPOS]
-
7
.
Biais dans les données [DIAPOS]
- 8. Réseaux de neurones [DIAPOS]
-
9
.
Architectures profondes [DIAPOS]
La première partie entre dans le concret des algorithmes tandis que la seconde donne un aperçu de notions plus avancées sans détails matheux.
Les TPs consistent en un ensemble de notebooks Jupyter en Python , inspirés du cours Data8 de UC Berkeley. Ils sont de deux types, fournis en alternance: (1) TP courts individuel noté automatiquement, durée 1 séance; (2) TP longs en binômes. Le dernier TP long se termine par une présentation orale finale. La structure d'un TP long est similaire à celle du TP court qui la précède, et en développe le sujet en demandant aux étudiants d'y appliquer d'autres données (soit des données suggérées, soit des données de leur choix).
A bientôt!
f aq
-
Équipe pédagogique
Chargée de cours: Isabelle Guyon guyon@chalearn.org
Chargés de TP:
- Fanny Pouyet fanny.pouyet@universite-paris-saclay.fr
- Albane Saintenoy Albane.Saintenoy@u-psud.fr
- Téo Sanchez teo.sanchez@lri.fr
- Haozhe Sun sunhaozhe275940200@gmail.com
- Nicolas M. Thiéry Nicolas.Thiery@u-psud.fr
Répartition des groupes
Du fait de la rotation présentiel/distanciel, les salles et chargés de TP varieront d'une semaine sur l'autre. Ici nous indiquons la répartition générale et la préciserons chaque semaine dans la section idoine.
Jeudi 15h45-17h45
- MI1: Téo (présentiel) et Haozhe (distanciel)
- MI2: Fanny (présentiel) et Haozhe (distanciel)
- LDD IM1: Téo, Fanny (présentiel), Haozhe (distanciel)
Vendredi 8h15-10h15
- MI3: Nicolas (présentiel) et Haozhe (distanciel)
- MI4: Albane (présentiel) et Haozhe (distanciel)
- LDD IM2: Nicolas, Albane (présentiel), Haozhe (distanciel)
-
Messages récents
-
Cours (Diapos)
Ce cours a couvert une introduction à la science des données et aux statistiques descriptives.
TP (Sujet)
Jeudi 15h45-17h45
- MI1: Téo (213; débordement sur Nautilus A si nécessaire)
- MI2: Haozhe (distanciel: salle virtuelle)
- LDD IM1: Fanny (Nautilus A & B)
Vendredi 8h15-10h15
- MI3: Nicolas (314, 315)
- MI4: Haozhe (distanciel: salle virtuelle)
- LDD IM2: Albane (Nautilus A & B)
Activités : 1 -
Cours (Diapos)
TP (Sujet)
Jeudi 15h45-17h45
- LDD IM1: Téo (213; débordement sur Nautilus A si nécessaire)
- MI2: Fanny (Nautilus A & B)
- MI1: Haozhe (distanciel: salle virtuelle)
Vendredi 8h15-10h15
- LDD IM2: Nicolas (314, 315)
- MI4: Albane (Nautilus A & B)
- MI3: Haozhe (distanciel: salle virtuelle)
Activités : 1 -
Cours (Diapos)
- Récapitulation de la leçon précédente et précisions de certains points
- Introduction du mini-projet 1
- Fin des rappels de statistiques
TP (Sujet)
- Début mini-projet 1
Jeudi 15h45-17h45
- MI 1: Téo (213; débordement sur Nautilus A si nécessaire)
- MI 2: Fanny (Nautilus A & B)
- LDD IM 1: Haozhe (distanciel: salle virtuelle)
Vendredi 8h15-10h15
- MI 3: Nicolas (314, 315)
- MI 4: Albane (Nautilus A & B)
- LDD IM 2: Haozhe (distanciel: salle virtuelle)
Activités : 0 -
Cours (Diapos)
- Construction et sélection d'attributs (features)
TP (Sujet)
- Suite du mini-projet 1
Jeudi 15h45-17h45
- MI 1 et LDD IM 1: Téo Sanchez (Nautilus A & B)
Si débordement: salle 213, avec aide à distance par Fanny Pouyet - MI 2: Haozhe Sun, Fanny Pouyet (distanciel: salle virtuelle)
Vendredi 8h15-10h15
- MI 3: Nicolas (314, 315)
- LDD IM 2: Albane (Nautilus A & B)
- MI 4: Haozhe (distanciel: salle virtuelle)
Activités : 1 -
Devoir: Finir le QUIZ 3
Cours (Diapos: PPT, PDF)
- Classifieurs
TP (Sujet)
- Suite et fin du mini-projet 1
Jeudi 15h45-17h45
- LDD IM 1: Téo Sanchez (213; débordement sur Nautilus A si nécessaire)
- MI 2: Fanny Pouyet (Nautilus A & B)
- MI 1: Haozhe Sun (distanciel: salle virtuelle)
Vendredi 8h15-10h15
- LDD IM 2: Téo Sanchez (314, 315)
- MI 4: Albane Saintenoy (Nautilus A & B)
- MI 3: Haozhe Sun (distanciel: salle virtuelle)
Activités : 0 -
COURS
DIAPOS Google slides, DIAPOS PDF, DIAPOS PPTX
TP (Sujet)
Jeudi 15h45-17h45
- MI 1: Téo Sanchez (213; débordement sur Nautilus A si nécessaire)
- MI 2: Fanny Pouyet (Nautilus A & B)
- LDD IM 1: Haozhe Sun (distanciel: salle virtuelle)
Vendredi 8h15-10h15
- MI 3: Téo Sanchez (314, 315)
- MI 4: Albane Saintenoy (Nautilus A & B)
- LDD IM 2: Haozhe Sun (distanciel: salle virtuelle)
Activités : 1 -
Cours (Diapos PPT, PDF)
TP (Sujet)
Jeudi 15h45-17h45
- MI 1: Téo Sanchez (213; débordement sur Nautilus A si nécessaire)
- LDD IM 1: Fanny Pouyet (Nautilus A & B)
- MI 2: Haozhe Sun (distanciel: salle virtuelle)
Vendredi 8h15-10h15
- MI 3: Téo Sanchez (314, 315)
- LDD IM 2: Albane Saintenoy (Nautilus A & B)
- MI 4: Haozhe Sun (distanciel: salle virtuelle)
Veuillez trouver la fiche d'inscription pour les groupes du projet 2 ici
Activités : 1 -
-
Finalement, nous allons satisfaire votre curiosité!! Le fameux Deep Learning qui a pris l'Intelligence Artificielle comme un raz de marée.
[DIAPOS PPT] [DIAPOS PDF]
TP (Sujet)
Jeudi 15h45-17h45
- MI 1: Nicolas Thiéry (213; débordement sur Nautilus A si nécessaire)
- MI 2: Fanny Pouyet (Nautilus A & B)
- LDD IM 1: Haozhe Sun (distanciel: salle virtuelle)
Vendredi 8h15-10h15
- MI 3: Téo Sanchez (314, 315)
- MI 4: Albane Saintenoy (Nautilus A & B)
- LDD IM 2: Haozhe Sun (distanciel: salle virtuelle)
Activités : 1 -
Inscription
Vous devez vous inscrire, par binome afin de choisir votre heure de passage. Lien pour s'inscrire
Dates et heures
- MI 1: mardi 1 Juin après-midi, salle 209 (Téo Sanchez)
- MI 2: mardi 1 Juin après-midi, salle Nautilus B (Fanny Pouyet)
- MI 3 et MI4: vendredi 28 Mai après-midi, 309 (Albane Saintenoy) ou mardi 1 matin, Nautilus B (Nicolas Thiéry)
- LDD IM 1: lundi 31 Mai matin, distanciel (Haozhe Sun)
- LDD IM 2: lundi 31 Mai après-midi, distanciel (Haozhe Sun)
Activités : 1