Mathador et big data : les chercheurs s’attaquent aux données
Quatre mois de jeu par les classes participantes ont déjà été enregistrés dans la base de données : de quoi commencer à explorer les datas pour les chercheurs associés au projet e-FRAN. Mais comment vont-ils procéder pour identifier des profils de calculants au sein de ces données massives ?
Des colonnes de nombres et de signes, associés à des scores, des numéros d’identification et des horaires : voilà globalement ce qu’on peut trouver dans les bases de données à disposition des scientifiques du projet.
Il s’agit maintenant de trouver les moyens d’identifier parmi les 700 000 lignes de calcul attendues quelles sont les connaissances les plus mobilisées par les élèves, les stratégies de calcul des uns et des autres, les comportements types…
Data driven ou theory based ?
Deux approches peuvent être distinguées dans les recherches sur les big data :
– L’approche data driven, qui part de l’observation des données pour en tirer des enseignements : en classant les élèves en groupes, en cherchant leurs points communs ou au contraire des facteurs discriminants…
– L’approche theory based : qui repose sur des modèles théoriques, dont on cherche la confirmation dans les données.
L’équipe scientifique du projet réunit trois disciplines, qui vont combiner ensemble ces deux approches. Les trois chercheurs ont débuté leurs travaux chacun sur une piste parallèle :
– Isabelle Ludier, doctorante en didactique, a commencé par des observations sur le terrain : pratique des enseignants, organisation des temps de jeux, comportement des élèves lors des parties, stratégies développées, etc.
– Sébastien Puma, post-doctorant en cognition, s’est quant à lui attaqué à la bibliographie : il existe une littérature abondante autour de l’apprentissage du calcul mental. Si aucune étude comparable au projet n’a été menée, un certain nombre de dispositifs sont riches d’enseignement.
– Mathieu Saumard, post-doctorant en statistiques, a commencé la fouille des données. La première étape lui a permis de comprendre et s’approprier l’architecture des différentes bases de données Mathador (celles des jeux Solo et Chrono, celles des concours 2016 et 2017). La seconde, qu’il vient de commencer, consiste à classer les joueurs et les épreuves pour chercher à constituer des groupes cohérents.
Une approche plurielle
Les échanges réguliers entre ces trois chercheurs leur permettent déjà d’enrichir leurs approches respectives et de formuler collectivement des hypothèses sur les pistes à suivre. Parmi les premiers fils qui seront tirés par l’équipe, on peut citer :
– l’analyse des réponses au concours Mathador, qui se caractérise par la disposition de milliers de réponses pour une même épreuve de calcul et une progression des épreuves dans le temps ;
– l’utilisation de la touche « Effacer » : les observations du terrain ont mis en lumière combien il s’agissait d’une stratégie à part entière pour certains élèves, à qui elle permet d’approcher un résultat en tâtonnant ;
– les actions des joueurs hors norme : par exemple ceux qui obtiennent de très bons scores, ceux qui jouent énormément, ceux qui ne progressent pas, etc.
Les prochains mois vont être consacrés à creuser et multiplier ces angles d’approche, qui dessineront au fur et à mesure des profils de calculants de plus en plus précis.