Interview de Matthieu Saumard, chercheur au sein du projet e-FRAN
Matthieu Saumard est docteur en mathématiques appliquées et agrégé de mathématiques. Pour le projet e-FRAN « Un territoire calculant », il effectue un post-doctorat en données massives au Cnam (Conservatoire national des arts et métiers).
Quel est votre parcours ?
J’ai suivi un parcours universitaire en mathématiques. Après l’obtention de l’agrégation, j’ai enseigné deux ans en collège et lycée. Ma thèse en poche, je suis parti au Chili. J’y occupais un poste de maître de conférence à l’université de Valparaiso. Je suis revenu en France en 2016 et j’ai rejoint le Cnam pour travailler sur le projet.
Quels sont les liens entre vos recherches et ce projet ?
Mon thème de recherche porte sur les données fonctionnelles d’un point de vue théorique et appliqué. Une donnée fonctionnelle, c’est une donnée qui va évoluer selon une courbe aléatoire : des températures, des taux d’intérêt.. Les étudier permet de trouver une logique et de prédire leur évolution en fonction de différents paramètres.
Au départ, le lien avec Mathador n’était pas évident… Puis j’ai considéré l’évolution semaine après semaine des différents indicateurs portant sur les compétences des élèves. Ces indicateurs d’évolution constituent des courbes qui sont également des données fonctionnelles. Le lien se fait donc plus étroit au fur et à mesure entre le projet e-FRAN et mon thème de recherche.
Quels sont vos objectifs pour ce projet ?
Mon objectif premier est d’approfondir, voire inventer certaines méthodes de machine learning ou apprentissage automatique, et notamment la classification non-supervisée, appliquées à ce genre de données fonctionnelles.
Le learning analytics est en plein essor avec l’avènement du numérique. Ce champ disciplinaire repose largement sur les statistiques descriptives et inférentielles, mais aussi sur la capacité de traiter des données massives (Big Data) et d’en extraire de l’information pertinente. C’est un sujet magnifique que je souhaite explorer.
Pourriez-vous nous faire un bref point d’étape ?
Je viens d’achever de « défricher » la base de données. Cela permet une meilleure vue d’ensemble de ce qui nous attend, et a permis de bien amorcer la construction d’indicateurs et l’observation de leur évolution temporelle, en lien avec les deux autres chercheurs participant au projet.
J’applique actuellement les techniques de clustering ou partitionnement de données sur ces indicateurs : une méthode qui permet de procéder à la fois à un traitement plus rapide des données, et à une classification de ces données. Cela permet d’avancer dans la compréhension des joueurs, des épreuves, des stratégies de résolution.
En parallèle, je poursuis mon travail de bibliographie, élément indispensable à toute recherche, et je participe à un certain nombre de conférences.
Dans quel laboratoire de recherche travaillez-vous ? Décrivez-nous votre espace de recherche.
Je travaille au laboratoire CEDRIC, au sein de l’équipe MSDMA du Cnam à Paris.
À quand les résultats ?
Bientôt j’espère ! Le travail sur les indicateurs et le suivi de leur évolution devrait permettre de commencer à élaborer les outils de suivi des élèves par les enseignants dans les semaines qui viennent.
Jeu et mathématiques, le duo gagnant ?
Je pense que l’on a un parfait exemple avec Mathador, « machine » à motiver les élèves.