Peut-être serez-vous d’accord pour dire que les personnes intéressées par l’intelligence artificielle (IA) en éducation appartiennent à deux tribus bien distinctes. Les premières utilisent l’IA pour enrichir les processus d’apprentissage, sans forcément chercher à comprendre ce qu’il y a « sous le capot ». Pragmatiques, elles ont développé des compétences empiriques pour générer du contenu, personnaliser l’apprentissage ou automatiser des tâches. Elles savent qu’un modèle de langage (tel que Chat GPT) fonctionne par prédiction du mot suivant et parviennent à l’exploiter lorsque c’est pertinent, conscientes des enjeux sociétaux et environnementaux du numérique (Baillifard et al., 2024). L’autre tribu parlait de GPT déjà en 2018. Ses membres, familiers avec des concepts spécialisés comme Gating Networks ou Fine-Tuning, peuvent discuter des implications du test de Turing ou de la conférence pionnière de Dartmouth (1956). Maîtrisant la programmation de réseaux de neurones et l’optimisation des performances d’un modèle, ces technologues peuvent entraîner leurs propres modèles sur des corpus éducatifs. Loin d’être antinomiques, ces deux postures se complètent et s’enrichissent (Crompton et Burke, 2023). Ce n’est pas surprenant puisque c’est la rencontre entre sciences formelles (mathématiques, informatique, logique) et humaines (philosophie, neurosciences, linguistique) qui a permis à des machines d’imiter des processus tels que l’apprentissage, l’adaptation ou l’autocorrection (Popenici et Kerr, 2017). Ainsi, l’IA surgit après des décennies d’essais-erreurs pour mieux approcher les fonctions cognitives humaines et, naturellement, quand on plonge dans son univers, on aperçoit, en filigrane, les principes fondamentaux de l’apprentissage. Qu’il s’agisse d’un cerveau ou d’une IA, l’apprentissage repose sur un processus itératif où les connexions neuronales s’ajustent progressivement pour produire des réponses pertinentes. Un neurone, qu’il soit biologique ou artificiel, s’active ou produit une réponse lorsqu’un signal dépasse un seuil d’activation. Dès 1957, l’informaticien et psychologue Rosenblatt conçoit le perceptron, un modèle de neurone artificiel capable de séparer des informations en deux catégories. Pour y parvenir, le perceptron ajuste l’importance de chaque connexion et le seuil à partir duquel il s’active. Le perceptron pourrait être utilisé pour filtrer des courriels en spam ou non-spam selon la présence de certains mots-clés. Cependant, cette approche présente la limite fondamentale de ne résoudre que des problèmes linéaires, c’est-à-dire ceux où une séparation entre deux catégories est possible. Il faut attendre 1986 pour qu’Hinton et Rumelhart popularisent l’algorithme de rétropropagation du gradient qui permet l’entraînement des réseaux de neurones multicouches. Grâce à cette technique, le réseau ajuste automatiquement ses paramètres après chaque itération d’apprentissage, en cherchant à améliorer progressivement ses prédictions. Ce principe (deep learning) marque l’émergence de machines capables d’apprendre par elles-mêmes. Il reflète des aspects universels de l’apprentissage, tels que le besoin de répétition ainsi que les rôles de l’erreur et de la rétroaction. Tout comme un processus itératif permet à un réseau de neurones artificiels de s’ajuster, un élève apprend en expérimentant, en se trompant et en corrigeant ses réponses grâce à des retours fréquents et pertinents (Baillifard, 2024). Si l’apprentissage profite du couple essais-erreurs, il ne saurait s’y réduire. L’adaptabilité et le transfert des connaissances sont tout aussi essentiels. Prenons l’exemple d’AlphaZero, qui a atteint un niveau surhumain aux échecs en jouant sans cesse contre elle-même. Cette recette faite de répétitions, d’erreurs, et de rétroactions ne lui permet pas de transférer ses compétences à un autre jeu, comme le poker. AlphaZero est enferrée dans son apprentissage, semblable à un élève récitant ses tables de multiplication sans avoir appris à multiplier : il serait en peine de trouver le résultat d’une multiplication qu’il n’aurait pas apprise par coeur. En IA, quand les données d’entraînement manquent de variété, les modèles peinent à généraliser. Ainsi, certains algorithmes de diagnostic détectent …
Parties annexes
Bibliographie
- Baillifard, A. (2024). Apprendre : une aventure. Cahiers pédagogiques, 594(5), 47‑49. https://doi.org/10.3917/cape.594.0047
- Baillifard, A. et Bonvin, M. (2023). Ni plagosus Orbilius, ni pur enseignement positif. Qu’est-ce qu’enseigner ? Médiations et médiatisations, 13. https://doi.org/10.52358/mm.vi13.361
- Baillifard, A., Ertz, O., Lecorney, S. et Martarelli, C. (2024). Mythes écologiques du numérique. Formation et profession, 32(1), 13. https://doi.org/10.18162/fp.2024.a322
- Buolamwini, J. et Gebru, T. (2018). Gender shades: Intersectional accuracy disparities in commercial gender classification. Proceedings of Machine Learning Research, 81, 77-91. https://proceedings.mlr.press/v81/buolamwini18a.html
- Crompton, H. et Burke, D. (2023). Artificial intelligence in higher education: The state of the field. International Journal of Educational Technology in Higher Education, 20(1), 22. https://doi.org/10.1186/s41239-023-00392-8
- Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S. et Kiela, D. (2020). Retrieval-augmented generation for knowledge-intensive NLP Tasks. Arxiv. https://doi.org/10.48550/ARXIV.2005.11401
- Popenici, S. A. D. et Kerr, S. (2017). Exploring the impact of artificial intelligence on teaching and learning in higher education. Research and Practice in Technology Enhanced Learning, 12(1), 22. https://doi.org/10.1186/s41039-017-0062-8
- Reboul, O. (2010). La philosophie de l’éducation. PUF. https://doi.org/10.3917/puf.rebou.2010.01
- Rumelhart, D. E., Hinton, G. E. et Williams, R. J. (1986). Learning representations by back-propagating errors. Nature, 323, 533–536. https://doi.org/10.1038/323533a0

