Publications

Optimisation de l’apprentissage grâce à l’utilisation des learning analytics

Publié le 15 avril 2022

Depuis le début des années 2010 et plus encore à la suite de la pandémie actuelle de la COVID-19, l’apprentissage est numérisé et les environnements d’apprentissage sont digitalisés. Ce développement croissant entraîne de ce fait, un « boom » des données collectées à partir des différentes plateformes d’apprentissage. Ainsi, l’intérêt actuel des learning analytics n’est que le reflet de ce que connaît également le Big Data. Le Big Data se caractérise par trois facteurs qui sont le volume, la vélocité et la variété. Il permet ainsi de comprendre les usages et les pratiques des individus mais aussi de concevoir des modèles théoriques et comportementaux et prédire des tendances. De cette manière, le Big Data s’inscrit aussi bien dans l’immédiateté en ayant accès en temps réel aux besoins et aux habitudes des individus et dans le long terme pour la création de modèles prédictifs.        

Les raisons de l’intérêt continu pour les learning analytics se trouvent surtout dans la quantité massive de données sur l’éducation, de l’augmentation continue de la puissance de traitement et de la motivation à déduire de nouvelles informations des données disponibles.       

Les learning analytics ou analytique des apprentissages numériques en français, se définissent, d’après Messieurs Siemens et Baker de 2012, reprises par Messieurs Fischer, Hmelo-Silver, Goldman et Reimann en 2018, comme « the measurement, collection, analysis and reporting of data about learners and their contexts, for purposes of understanding and optimizing learning and the environments in which it occurs ». Plus simplement, il s’agit d’un outil de compréhension des processus d’apprentissage et du contexte permettant la découverte et la prédiction. Il peut également servir à l’amélioration même des processus dans les environnements numériques.    

Cette économie en devenir n’est que la partie émergée du Big Data et celle-ci intéresse particulièrement les entreprises et les grands groupes commerciaux qui cherchent à mieux comprendre les habitudes et les pratiques des apprenants en tant que consommateurs pour mieux cibler et optimiser leurs offres commerciales et bien sûr prédire les tendances à venir. D’après une étude menée par le Center for Digital Education auprès d’enseignants du supérieur, les principaux bénéfices de l’analyse du Big Data dans l’éducation serait le suivi et la prédiction des performances d’un élève (69%), l’augmentation du taux de diplômés (61%), l’ajustement en temps réel des programmes (47%), la mesure de la performance institutionnelle de l’établissement (44%) et la mise en évidence d’éventuelles failles dans l’administration grâce à l’analyse (22%).    

Il s’agit d’un ensemble d’enjeux à traiter dès maintenant pour ne pas être pris par la vitesse du développement technologique et être dépassé par les évènements.

1. L’utilisation des learning analytics à des fins éducatives

1) La spécificité des learning analytics

Les learning analytics sont des techniques informatiques, mathématiques et statistiques permettant de déceler des informations pertinentes à partir d’un ensemble massif de données. Il faut donc interpréter le terme « analytique » comme une action effectuée dans l’objectif de comprendre et même de prédire des actions futures en poursuivant une volonté de performance et d’efficacité de plus en plus importante. Cette méthode se rapproche sensiblement de la science des données (Data Science) et répond de ce fait au principe du Data Mining.    

La matière des learning analytics se distingue des deux méthodes scientifiques précédentes car elle est pluridisciplinaire et œuvre pour la conception d’environnement informatique favorable à l’apprentissage humain.    

Les raisons qui ont poussé les scientifiques à s’intéresser tout particulièrement aux learning analytics sont : 

– L’énorme volume de données à la disposition des chercheurs qui permet une progression rapide et la multiplication des dispositifs d’apprentissage en ligne comme le Learning Management System, les MOOC). Tous permettent d’isoler les interactions des utilisateurs lors d’apprentissage en ligne. Il est aussi possible de croiser ces données avec les données académiques.

– La structuration de ces données permet une utilisation rapide et par conséquent davantage d’interopérabilité pour les chercheurs. 

– Les appareils utilisés, aujourd’hui, pour suivre des enseignements en ligne, comme les ordinateurs, les smartphones ou les tablettes, ont des capacités de calculs extrêmement importantes.      

– Les programmations informatiques (framework), notamment Apache Hadoop, Rapid Miner, KEEL, SNAPP, permettent une gestion et la mesure des données issues de l’Internet. En effet, de nombreux outils d’analyse sont progressivement adaptés à l’éducation comme la Business intelligence sans pour autant avoir de connaissances préalables en sciences statistiques.

2) Les caractéristiques indispensables aux learning analytics

Les learning analytics permettent de suivre les données produites au cours des activités d’apprentissage. Ainsi, lesdites données peuvent être de nature classique c’est-à-dire provenant des résultats aux examens, du taux de participation au cours des activités et plus généralement du taux de présence, des examens de fin d’année et des diplômes obtenus. Il s’agit des données traditionnellement collectées par les enseignants en présentiel. Mais progressivement, les nouveaux environnements numériques sont aussi des lieux de collecte de données comme c’est le cas pour les plateformes d’apprentissage, les espaces personnels sur l’intranet. Ces nouveaux écosystèmes fournissent des corpus de données considérables sur le comportement des apprenants allant de la connexion, aux différentes empreintes digitales déposées par ce dernier et qui sont automatiquement stockées par le serveur informatique avant d’être traitées par des algorithme capables d’analyser et d’établir le profil de l’utilisateur.     

 Toutes ces raisons rendent d’autant plus nécessaire le rappel des caractéristiques indispensables auxquels doivent répondre les learning analytics, qui sont :  

– La capitalisation et le recueil continu car les données collectées sont la matière première du processus.

– La multiplication et la pluridisciplinarité des sources de provenance des données (présentiel, distanciel, continue dès le début du parcours pédagogique).

– La quantité phénoménale de données produites par les apprenants à travers l’utilisation des outils numériques dans les environnements d’apprentissage.

– La spécificité car les données collectées portent uniquement sur l’activité des apprenants en vue d’améliorer l’expérience apprenante et les environnements d’apprentissage.

Subséquemment à ces différentes caractéristiques, trois fonctions majeures peuvent être rattachées aux learning analytics soit la fonction descriptive, la fonction prédictive et la fonction prescriptive. Chacune d’entre elles permet d’expliquer le dépassement d’analyse permis par l’analytique des apprentissages numériques par rapport au domaine classique des sciences de l’éducation.

A) La fonction descriptive

La fonction descriptive s’attache à décrire le contexte particulier dans lequel les apprenants évoluent. Cela s’étend donc des conditions aux attentes mêmes des apprenants au cours de leur apprentissage tout en prenant en considération les cours, les ressources disponibles et les tâches à effectuer sur l’environnement numérique. Autrement dit, il s’agit d’évoquer les caractéristiques de l’apprentissage, les stratégies d’apprentissage adoptées tout en sachant qu’il est possible de les faire varier.   

Dans cette analyse, trois éléments sont primordiaux pour prédire la réussite, l’échec ou l’abandon des appreants (l’un des objectifs des learning analytics) : 

– Les caractéristiques de l’environnement d’enseignement et plus précisément la manière dont l’apprentissage est dispensé aux apprenants.

– Les caractéristiques intrinsèquement liées aux apprenants.

– Les interactions réalisées entre l’environnement d’enseignement et les stratégies d’apprentissages employées par les apprenants.  

Au-delà d’un simple travail d’analyse, il s’agit d’une véritable étude des liens existant entre les trois éléments cités au-dessus devant permettre la réalisation de « profils » types auxquels les enseignants pourront se référer par la suite afin de reconnaître les situations dans lesquelles se trouvent chaque étudiant.

B) La fonction prédictive

La fonction prédictive quant à elle se concentre sur les tendances déterminées à partir du contexte et des situations des apprenants. Par la suite elles seront nuancées par le Machine learning. Grâce à ce système alimenté continuellement par de nouvelles données, il est possible d’influencer et de prédire la réussite des apprenants. 

C) La fonction prescriptive

La fonction prescriptive correspond à la réaction attendue à la suite de la situation qui a été décrite par les deux fonctions précédentes. Autrement dit, elle s’attache à proposer des recommandations individuelles pouvant soutenir, accompagner et guider les apprenants sur les objectifs qu’ils s’étaient fixés à l’origine. Les conseils proposés doivent s’appuyer sur les expériences passées et être suffisamment fiables.

3) Les objectifs de l’analytique des apprentissages numériques

A) La volonté de prédire la progression de l’apprenant

Grâce à l’accès en temps réel aux données d’apprentissage, les chercheurs ont développé des techniques d’analyse, qui se rapprochement sensiblement du Data Mining, permettant de classer les profils. Ces classifications prennent en considération les capacités de l’apprenant, l’adaptabilité du contenu, le niveau de déploiement des stratégies d’engagement et la lutte contre le décrochage.

B) La nécessité de mesurer les interactions sociales

L’analyse de l’apprentissage social est également appelée Social Learning analytics est se fonde sur l’analyse des réseaux sociaux et des communautés existantes en son sein, des sous-ensembles créés par ces réseaux mais aussi leur proximité, la fréquence des échanges, leur densité et les affinités qui en émergent. A partir de ces constats, il est possible d’identifier les personnes accompagnantes et donc de caractériser les liens entre les différents acteurs.  
      
L’étude des réseaux sociaux présente une nouvelle et vaste marge perspective d’approfondissement pour l’apprentissage social. Ils permettent d’élargir considérablement les techniques de mesures et de représentations de données biométriques grâce à l’usage récurrent des caméras qui permettent d’examiner la synchronisation des postures physiques. Sur cette lignée, il est tout à fait pertinent d’imaginer que demain il sera possible d’analyser de nouveaux indicateurs comme la voix ou le rythme cardiaque pour mesurer l’intensité des interactions sociales (GTnum2).  

C) Le besoin d’analyser les discours

Le langage conditionne, pour partie, le succès aux activités, l’utilisation des outils et la réussite des travaux communs. C’est pourquoi l’analyse du discours est un élément à prendre en compte par les learning analytics car il rend visible et permet donc d’améliorer la place de l’individu au sein du groupe.

D) L’importance de visualiser l’apprentissage : une aide à la prise de décision

Les learning analytics doivent être perçus comme des outils au service et en soutien à la régulation et à l’auto-régulation de l’apprentissage. Cela induit nécessairement la prise de conscience à partir des informations mises à disposition, la remise en question de l’apprenant, l’adaptabilité des stratégies d’apprentissage, la production de pistes de régulation et d’amélioration. Les learning analytics possèdent une grande variété d’atouts allant de l’objectivité des éléments (décisions, résultats et comportements) à la rapidité et la régularité des feedbacks à disposition des apprenants et des enseignants.

2. Les enjeux et les risques des learning analytics

1) L’importance de protéger les données à caractère personnel

Les learning analytics sont le fruit d’un cycle de traces passant par différentes étapes comme la collecte et le traitement. Il est indéniable que lesdites étapes soulèvent des questions en matière de protection des données à caractère personnel intimement liées au respect de la vie privée. Même les données qui semblent être « anodines » peuvent entacher le respect de la vie privée des individus. De plus, le consentement à la collecte de données, au traitement et à ce qu’elles soient réutilisées par des services en ligne pour des finalités spécifiques, distinctes et présentées à l’utilisateur ne permet que dans de rares cas de contrôler les informations qui seront potentiellement produites par l’agrégation automatisée des applications présentes sur les sites internet, les applications, etc… 

Le Règlement général sur la protection des données personnelles (RGPD) qui a été adopté en 2016 et est entré en vigueur le 25 mai 2018 tend à ralentir le développement des learning analytics. L’ensemble des traitements, entrepris par le logiciel utilisant des learning analytic, doit être licite et justifié. Le contexte a une très grande importance car en fonction de lui, le responsable de traitement et/ou son sous-traitant devront justifier de la licéité du traitement.  

Aujourd’hui, la protection des données fait partie intégrante de la démarche de recherche en matière de learning analytics.    

Dans le cas d’un projet de développement de learning analytics, les spécificités de chaque projet institutionnel devront être étudiées. Dans la plupart des cas, la démarche va a minima être confrontée au RGPD dans deux cas comme la collecte de données à grande échelle, le croisement de données ou encore l’usage innovant desdites données. Cela s’explique par le nombre important d’apprenants qui permettent de créer des interfaces personnalisées, de créer des profils types. Il faut tout de même savoir que l’analytique des apprentissages numériques traitent aussi des données de nature administrative (inscription…), des données de performance (résultats aux examens…), et des données d’usage ou d’utilisation des ressources d’apprentissages proposées par l’institution en question. En plus de cela, il est rare que les données soient stockées sur une seule et unique base de données.     

C’est pour toutes ces raisons qu’il est primordial de réaliser une analyse d’impact en amont et de la soumettre à l’approbation du délégué à la protection des données de l’institution.

Il appert que l’exploitation des données est centrale dans la démarche de l’analytique des apprentissages numériques. Les données sont donc un enjeu de taille pour cette discipline en pleine émergence. L’objectif demeure l’amélioration de la qualité de l’apprentissage sans augmenter la charge de travail des enseignants et autres personnels encadrants. L’automatisation au maximum est également un enjeu dans le processus de traitement des données car cela permet une rapidité décisionnelle des acteurs de l’apprentissage. Bien évidemment, l’automatisation doit, elle aussi, être conforme au RGPD.    
A cette première couche réglementaire, certains chercheurs ont proposé d’ajouter le modèle « DELICATE Checklist » afin de permettre aux praticiens des learning analytics une réflexion sur les aspects relatifs à la vie privée. Plus simplement l’idée est de continuer à placer l’humain au centre des préoccupations tout en faisant preuve de transparence et d’ouverture. Ce modèle n’est pas encore appliqué.

2) Le danger que représentent les learning analytics

Même si l’objectif des learning analytics est plutôt bienveillant par rapport à l’apprenant, leurs conditions d’utilisation et d’exercice peuvent soulever de nombreuses questions.   

En effet, malgré les principes issus du RGPD, ces derniers sont, au regard des learning analytics, des limites mais en réalité il est difficile de déterminer à l’avance quelles informations sur l’environnement et les résultats sont susceptibles d’être pertinentes pour l’étude. C’est pourquoi, l’activité même des learning analytics s’inscrit dans une démarche exploratoire permettant une modélisation a posteriori. Cela signifie que l’analytique des apprentissages numériques ne cherche pas à valider des hypothèses théoriques mais plutôt effectue des recherches pour émettre des hypothèses d’habitudes d’apprentissage en ligne. Le point de vue est complètement contraire à ce qui se fait dans le domaine des sciences humaines et sociales. C’est également difficilement compatible avec le principe de minimisation des données collectées prévu par le RGPD. D’où le fait que cette pratique soit si critiquée.           
Pour approfondir la problématique de la minimisation des données collectées, de nombreuses questions doivent être posées telles que la pertinence des données, se limite-t-on aux données d’apprentissage ? Est-ce que ce sont des données scolaires uniquement ou aussi sociales (étudiant boursier ou salarié…) ou même psychologiques ? (GTnum2).  
A cette première difficulté s’ajoute l’absence de définition officielle pour les données scolaires. Ainsi le périmètre couvert par ce type de données est particulièrement large allant des informations administratives, aux productions rendues en passant par les traces d’apprentissage. Cela explique pourquoi il est fondamental d’organiser une véritable réflexion éthique sur la récolte des données. La pertinence de la donnée se mesure au regard de la finalité poursuivie.   

Un autre danger qui a été quelque peu abordé est l’utilisation combinée des données sur l’apprentissage des apprenants à celles sur leur intimité corporelle (empreintes digitales ou reconnaissance faciale, etc…). La surveillance généralisée du corps par le biais des learning analytics est un vrai problème notamment pour les personnes entamant des études supérieures tout en étant encore mineures. Mais outre cette spécificité, la collecte de données physiologiques (comme l’exemple de Knewton) de manière précoce et sur des personnes qui sont susceptibles d’oublier que ces données ont un jour été collectées ; c’est un risque qu’il convient de prévoir. Il ne faut pas omettre qu’il existe le droit à l’oubli, d’où l’importance pour les apprenants d’avoir connaissance et conscience des données collectées.  

Un autre aspect important qui n’a pas du tout été mis en évidence est la possibilité offerte par les learning analytics de préserver l’anonymat ou du moins de contribuer à la confidentialité des données. L’anonymisation est un défi de taille car avec le croisement des données, il est très facile d’identifier les personnes sans avoir leur nom.

A) La surveillance permanente des apprenants

Il est impossible de contredire cette évidence : les learning analytics sont une forme de surveillance permanente pendant les cours ou examens. En effet, puisqu’il est possible de savoir, pour chaque apprenant, à quel moment il a lâché le cours, s’il a réécouté plusieurs fois une partie du cours etc… De même, l’utilisation de la caméra permet la reconnaissance faciale (intelligence artificielle) et donc la collecte de données physiologiques mais également d’enregistrer les émotions de l’apprenant. Cela renvoie encore une fois à l’importance du consentement et à la sensibilisation des apprenants sur la collecte de leurs données.   

Sans revenir sur le cas spécifique des mineurs, est-ce que dans le cadre éducatif le consentement est véritablement libre ? En effet, il est tout à fait légitime de s’interroger sur la question de savoir si, dans le cadre éducatif, l’étudiant peut être regardé comme donnant valablement son consentement au regard de l’autorité qu’exerce sur lui l’enseignant qui propose l’utilisation d’un tel outil ? Pour rappel, l’article 4 du RGPD dispose que le consentement constitue une « manifestation de volonté libre, spécifique, éclairée et univoque, par laquelle la personne concernée accepte, par une déclaration ou par un acte positif clair, que des données à caractère personnel la concernant fassent l’objet d’un traitement ». Cela est-il véritablement respecté quand il existe une forme d’autorité pesant sur la personne signataire à savoir l’apprenant qui va être évalué par ledit enseignant ?  
Nonobstant cette possible « pression » existante à consentir à la collecte des données pour utiliser l’outil soumis par le professeur, une autre question s’ajoute, celle de savoir si l’apprentissage s’inscrit dans le cadre d’une mission d’intérêt public ?       

B) L’absence de considération pour la personnalité

Les learning analytics servent à obtenir des informations sur l’apprentissage des apprenants et permettent donc de les classer les uns par rapport aux autres. Ainsi, les apprenants sont quantifiés ou plutôt leur personnalité est mesurée afin d’obtenir la meilleure performance. Autrement dit, l’analytique de l’apprentissage fragilise l’essence même de la personnalité de l’apprenant. De fait, en associant des plateformes d’apprentissages à des capteurs afin d’analyser toujours plus finement les réactions des apprenants et de proposer un accompagnement au plus proche des besoins de chacun en vue de mettre en place un apprentissage personnalisé.     

Les bénéfices attendus font face au phénomène du « quantified self » qui a été étudié en 2013 par la CNIL dans son étude « Le corps, nouvel objet connecté ». A force de quantifier les performances des apprenants, est-il possible que les apprenants développent une forme de normalisme obligatoire et anxiogène ? De même dans le cas inverse, la recherche de personnalisation de l’apprentissage dans le but d’améliorer les performances de l’apprenant ne risque pas de tourner à l’obsession ? D’autant que la réussite ne se reflète pas uniquement dans les résultats et sous forme de notes.   
En tout état de cause, les learning analytics ne doivent pas transformer les apprenants en « objet » d’apprentissage, ils doivent demeurer un service pour les acteurs. Autrement dit, la massification des données analysées et l’objectivation ne doivent pas contribuer à faire émerger une nouvelle discipline. Dans la même idée, l’apprenant ne doit pas tendre à devenir un simple producteur de données passif, la pertinence des données doit rester une priorité.