Corps de l’article
In any moment of decision, the best thing you can do is the right thing, the next best thing is the wrong thing, and the worst thing you can do is nothing.
– Theodore Roosevelt
Dans quel groupe sera classé cet étudiant ? Peut-on admettre cette candidate dans ce programme d’études contingenté ? Comment faire la sélection du meilleur candidat pour ce poste convoité ? L’étalonnage et la décision psychométrique traite d’un thème fondamental en psychométrie, soit la prise de décision, en offrant des réponses pertinentes à toutes ces questions. Nous présentons notre appréciation de cet ouvrage en divisant notre argumentaire en trois sections.
D’abord, nous présentons une synthèse du contenu de l’ouvrage, pour ensuite mettre en exergue les forces et les faiblesses de celui-ci. Enfin, nous discutons de son utilisation en contexte de formation à la recherche dans le domaine de l’éducation.
Synthèse du contenu de l’ouvrage
L’étalonnage et la décision psychométrique comporte sept grandes sections. La loi normale, qui est la trame de fond de cet ouvrage, est présentée dès la première page de la section A. Soutenu par quelques exemples, Laurencelle explique que le modèle normal est pertinent pour élaborer des normes. C’est aussi dans cette section que l’auteur présente le concept important de différentiel de sélection, qui est la moyenne espérée d’un nombre d’étudiants satisfaisant à un seuil de sélection défini.
La section B traite de la conversion normale ou quasi normale de rangs centiles. Les professionnels de l’éducation qui utilisent des échelles de mesure seront d’ailleurs heureux d’y retrouver des exemples à l’aide des échelles de type QI telles que les tests de Wechsler, de Stanford-Binet ou de Cattell.
La section C saura fort probablement intéresser les gens qui évoluent dans les bureaux d’admission des programmes universitaires contingentés puisque l’auteur discute de la sélection de candidats qualifiés.
Alors que les sections précédentes traitaient de la sélection de personnes à partir d’un seul test, les sections D et E portent sur l’importante question de la sélection d’une personne à partir des résultats de plusieurs tests. Laurencelle explique que ce contexte de décision engendre une complexité accrue, ce qui implique des regards différents sur le différentiel de sélection.
Les sections F et G portent sur l’incertitude d’une norme. Dans ce cas-ci, on souhaite « mesurer » une personne et la comparer à une norme pouvant être un seuil ou un niveau à atteindre. Or, puisque cette norme est de nature statistique, cela engendre de l’incertitude. Ces sections s’engagent donc à présenter des variantes paramétriques et non paramétriques permettant de contrôler cette incertitude.
Enfin, divers sujets d’intérêt sont traités dans la section H (p. ex., la taille et la précision d’un centile normal ou uniforme ainsi que la taille et les normes sûres normales protégées). Nous souhaitons mentionner la pertinence de la cinquième partie de cette section, qui porte sur la corrélation et son incertitude. L’auteur expose avec éloquence que « les inférences tirées d’informations psychométriques sur la base d’un coefficient [de corrélation] sont fragiles » (p. 181).
Forces et faiblesses de l’ouvrage
Plusieurs raisons nous poussent à croire que L’étalonnage et la décision psychométrique est un ouvrage important. D’abord, si la question de la décision en testing a déjà été abordée sous différents angles (Cronbach & Gleser, 1965 ; Cizek & Baunch, 2007), Laurencelle s’attaque à l’incertitude, qui n’a probablement pas reçu toute l’attention qu’elle méritait dans ce contexte. De plus, l’auteur expose l’importance de ne pas recourir aveuglément à la loi normale lors de la prise de décision psychométrique. Cela fait écho à des travaux importants sur le person-fit (Molenaar & Hoijtink, 1990 ; Snijders, 2001) et sur l’estimation de l’habileté dans les modélisations de la théorie de la réponse aux items (van den Oord, 2005 ; Woods, 2006). Nous sommes d’ailleurs heureux de voir que cette réflexion est toujours d’actualité. De plus, nous avons grandement apprécié les exemples insérés dans les différentes sections pour parfaire notre compréhension de la matière présentée. À ce titre, les nombreux tableaux préparés par l’auteur sont efficaces et intéressants. Enfin, le lecteur aura la chance de compter un nouvel ouvrage traitant d’un sujet aussi pointu et écrit dans la langue de Molière.
La plus grande faiblesse de cet ouvrage réside dans le fait que le lecteur doit posséder un peu plus que des connaissances de base en statistiques pour en apprécier le contenu. Dans la préface, Normand Pettersen déclare que cet ouvrage « n’est pas à la portée de tous » (p. VIII). Laurencelle ne s’en cache d’ailleurs pas : « Ce livre ne constitue pas un manuel d’introduction à la psychométrie, non plus qu’une initiation à l’étalonnage ou au diagnostic psychométrique » (p. 5). Ainsi, le lecteur en éducation aura probablement besoin d’avoir quelques références en main afin de bien suivre l’argumentaire. Or, c’est spécifiquement sur ce plan que réside le problème : il nous semble qu’il aurait été possible de vulgariser davantage le contenu de L’étalonnage et la décision psychométrique sans en hypothéquer la précision. À titre d’exemple, Kaplan (2014) a présenté un ouvrage digeste et précis sur les modèles bayésiens, qui ne sont pourtant pas reconnus pour leur simplicité.
Une autre faiblesse a trait au fait qu’il aurait été intéressant de rattacher la question de la décision à l’un des concepts les plus importants en psychométrie: la validité. Même si l’auteur s’intéresse surtout aux aspects techniques de la décision (et cela est honorable), son propos engendre de nombreuses questions qui touchent aux questions éthiques de la validité. Ne l’oublions pas : la décision à partir de normes est un sujet délicat puisqu’elle n’est pas exempte d’erreurs et peut engendrer des conséquences négatives (Kane, 2001).
Enfin, nous nous demandons pourquoi l’auteur et l’éditeur de l’ouvrage n’ont pas intégré de code de programmation dans le livre ou sur un site web d’accompagnement. Cette stratégie aurait permis au lecteur de bonifier sa compréhension du contenu complexe de l’ouvrage en ayant la possibilité d’effectuer lui-même les analyses.
Utilisation de l’ouvrage en contexte de formation à la recherche
Nous jugeons que L’étalonnage et la décision psychométrique s’adresse à un public expert et qu’il est peu adapté au public étudiant en sciences de l’éducation. Ainsi, nous recommandons surtout son usage au sein de séminaires spécialisés ou en complément à un cours de statistiques ou de psychométrie à la maîtrise ou au doctorat. Par contre, cette mise en garde n’affecte en rien la pertinence du propos de Laurencelle et nous avons l’intime conviction que cet ouvrage devrait faire partie de la bibliothèque des étudiants, des chercheurs et des praticiens qui ont un intérêt marqué pour les statistiques et la mesure.
Parties annexes
Références
- Cizek, G. J., & Bunch, M. B. (2007). Standard setting: A guide to establishing and evaluating performance standards on tests. Thousand Oaks, CA: SAGE Publications.
- Cronbach, L. J., & Gleser, G. C. (1965). Psychological tests and personnel decisions. Champaign, IL: University of Illinois Press.
- Kane, M. T. (2001). Current concerns in validity theory. Journal of Educational Measurement. 38, 319-342. Retrieved from http://202.197.120.98/Downloads/LangTst/tst_007.pdf
- Kaplan, D. (2014). Bayesian statistics for the social sciences. New York, NY: Guilford Press.
- Molenaar, I. W., & Hoijtink, H. (1990). The many null distributions of person fit indices. Psychometrika, 55, 75-106. doi: 10.1007/BF02294745
- Snijders, T. A. B. (2001). Asymptotic null distribution of person fit statistics with estimated person parameter. Psychometrika, 66, 331-342. doi: 10.1007/BF02294437
- Van den Oord, E. J. C. G. (2005). Estimating Johnson curve population distributions in MULTILOG. Applied Psychological Measurement, 29, 45-64. doi: 10.1177/0146621604269791
- Woods, C. M. (2006). Ramsay-curve item response theory (RC-IRT) to detect and correct for nonnormal latent variables. Psychological Methods, 11, 253-270. doi: 10.1037/1082-989X.11.3.253