Abstracts
Résumé
Cet article compare trois méthodes d’évaluation des aspects paraverbaux dans les productions orales : la méthode holistique absolue (note globale), la méthode analytique absolue (grille critériée) et la méthode holistique comparative (logiciel Comproved). Trois questions principales guident l’étude : 1) Quelle est la fiabilité inter-évaluateurs de chaque méthode ? 2) Quelle est la corrélation entre ces méthodes ? et 3) Quels écarts de notation observe-t-on entre elles ? Chaque méthode a été utilisée pour évaluer des productions orales sur des critères paraverbaux tels que l’intonation, le volume et les pauses. Les résultats révèlent que, contrairement aux attentes, la méthode holistique absolue présente la meilleure fiabilité inter-évaluateurs. Bien que des corrélations significatives existent entre les méthodes, des écarts de notation importants subsistent. Ces résultats remettent en question l’utilisation systématique des grilles critériées et montrent qu’il est crucial d’adapter les méthodes d’évaluation aux objectifs spécifiques, notamment pour les aspects paraverbaux des productions orales.
Mots-clés :
- évaluation orale,
- comparaison des méthodes,
- aspects paraverbaux,
- fiabilité inter-évaluateurs,
- grille critériée
Abstract
This article compares three methods for assessing paraverbal aspects in oral productions: the holistic absolute method (overall score), the analytical absolute method (criterion-based rubric), and the holistic comparative method (Comproved software). The study addresses three key questions: 1) What is the inter-rater reliability of each evaluation method ? 2) What is the correlation between these methods ? 3) What differences in scoring can be observed among these methods ? Each method was used to evaluate oral productions based on paraverbal criteria such as intonation, volume, and pauses. The results reveal that, contrary to expectations, the holistic absolute method demonstrated the highest inter-rater reliability. Although significant correlations were found between the methods, notable discrepancies remained in the grading of the same productions. These findings question the systematic use of criterion-based rubrics and emphasize the need to adapt evaluation methods to specific objectives, particularly for assessing paraverbal aspects of oral productions.
Keywords:
- oral assessment,
- comparison of methods,
- paraverbal aspects,
- criterion-based rubric,
- inter-rater reliability
Resumo
Este artigo compara três métodos de avaliação dos aspetos paraverbais nas produções orais: o método holístico absoluto (nota global), o método analítico absoluto (rubrica) e o método holístico comparativo (software Comproved). Três questões principais orientam o estudo: 1) Qual é a fiabilidade intra-avaliadores de cada método? 2) Qual é a correlação entre esses métodos? 3) Que discrepâncias de pontuação se observam entre eles? Cada método foi utilizado para avaliar produções orais com base em critérios paraverbais como a entoação, o volume e as pausas. Os resultados revelam que, contrariamente às expectativas, o método holístico absoluto apresenta a melhor fiabilidade entre avaliadores. Embora existam correlações significativas entre os métodos, subsistem discrepâncias importantes nas pontuações. Estes resultados colocam em causa o uso sistemático de rubricas e mostram que é crucial adaptar os métodos de avaliação aos objetivos específicos, especialmente no que diz respeito aos aspetos paraverbais das produções orais.
Palavras chaves:
- aspectos paraverbais,
- avaliação oral,
- comparação de métodos,
- fiabilidade entre avaliadores,
- rubrica
Appendices
Bibliographie
- Aguert, M., Laval, V., & Bernicot, J. (2010). Comprendre l’intention communicative du locuteur : une étude du rôle de l’intonation et du contexte chez des enfants de 5 à 9 ans. L’Année psychologique, 110, 49-70. https://doi.org/10.3917/anpsy.101.0049
- Alpes, Y. (2012). À propos de PISA : pourquoi, pour qui, évaluer et comparer les compétences des élèves ? Questions Vives. Recherches en éducation, 6(16), 11-14. https://doi.org/10.4000/questionsvives.892
- Alrabadi, E. (2011). ¿Qué método se debe adoptar para la enseñanza/aprendizaje de la comunicación oral ? [Quelle méthodologie faut-il adopter pour l’enseignement/apprentissage de l’oral ?] Didáctica. Lengua y Literatura, 23, 15-34. https://doi.org/10.5209/rev_DIDA.2011.v23.36308
- Aouchiche-Ait Yala, O., & Zoubida, B. (2022). Les défis de l’évaluation de l’oral. Pratiques & didactique, 1(1), 72-86. https://www.asjp.cerist.dz/en/downArticle/764/1/1/177627
- Aubergé, V. (2002). Prosodie et émotion. Actes des deuxièmes assises nationales du GdR, I3. https://www.researchgate.net/publication/228760016_Prosodie_et_emotion
- Balan, A., & Jönsson, A. (2018). Increased explicitness of assessment criteria: Effects on student motivation and performance. Frontiers in Education, 3, 81. https://doi.org/10.3389/feduc.2018.00081
- Barbier, É., & Colognesi, S. (2024). Les pratiques préconisées en formation pour faire la classe interviennent-elles dans les planifications des futurs enseignants de français ? Revue Canadienne de l’Éducation, 47(1), 113-148.
- Barkaoui, K. (2010). Explaining ESL essay holistic scores: A multilevel modeling approach. Language Testing, 27(4), 515-535. https://doi.org/10.1177/0265532210368717
- Bélec, C. (2017). Pourquoi évaluer ? Pédagogie collégiale, 30(4), 10-16. https://eduq.info/xmlui/bitstream/handle/11515/35711/belec-30-4-2017.pdf ?sequence=2&isAllowed=y
- Berthiaume, D., David, J., & David, T. (2011). Réduire la subjectivité lors de l’évaluation des apprentissages à l’aide d’une grille critériée : repères théoriques et applications à un enseignement interdisciplinaire. Revue internationale de pédagogie de l’enseignement supérieur, 27(2). http://ripes.revues.org/524
- Boureux, M. (2017). Mieux percevoir pour mieux prononcer. Quelle phonétique corrective pour aider les apprenants italiens à bien parler français. Rivista Interculturale, Università di Lecce, 43-68. http://magali.boureux.com/IMG/pdf/2017-03-11_actesrome2016boureux.pdf
- Bourhis, V. (2012). Situation de lecture en toute petite section : le rôle du paraverbal. Le Français aujourd’hui, (4), 85-97. https://doi.org/10.3917/lfa.179.0085
- Bourhis, V. (2014). Voix du maître, voix de l’élève : un dialogisme interlocutif. Éla. Études de linguistique appliquée, 173, 73-85. https://doi.org/10.3917/ela.173.0073.
- Bouwer, R., & Koster, M. (2016). Bringing writing research into the classroom. The effectiveness of Tekster, a newly developed writing program for elementary students. [Thèse de doctorat, Utrecht University]. Utrecht University Repository https://dspace.library.uu.nl/handle/1874/338041
- Bouwer, R., Koster, M., & van den Bergh, H. (2023). Benchmark rating procedure, best of both worlds ? Comparing procedures to rate text quality in a reliable and valid manner. Assessment in Education: Principles, Policy & Practice, 30(3–4), 302–319. https://doi.org/10.1080/0969594X.2023.2241656
- Bramley, T. (2007). Paired comparison methods. Dans P. Newton, J. A. Baird, H. Goldsteing, H. Patrick, & P. Tymms (dir.), Techniques for monitoring the comparability of examination standards (p. 246–300). QCA.
- Candea, M. (2000). Contribution à l’étude des pauses silencieuses et des phénomènes dits « d’hésitation » en français oral spontané. Étude sur un corpus de récits en classe de français [Thèse de doctorat, Université de la Sorbonne nouvelle-Paris III]. HAL. https://theses.hal.science/tel-00290143v1
- Chabanne, J. C. (1999). Verbal, paraverbal et non-verbal dans l’interaction verbale humoristique. Dans J. M. Defays, & L. Rosier (dir.), Approches du discours comique (p. 35-53). Mardaga. https://hal.science/hal-00921934
- Cicchetti, D. V. (1994). Guidelines, criteria, and rules of thumb for evaluating normed and standardized assessment instruments in psychology. Psychological Assessment, 6(4), 284–290. https://doi.org/10.1037/1040-3590.6.4.284
- Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2e éd.). Lawrence Erlbaum Associates, Publishers.
- Colognesi, S., Coppe, T., Leroux, L., & Wiertz, C. (2024). Does pedagogical metamorphosis exist ? Exploring the practices of primary school teachers at different stages of their careers. British Educational Research Journal, 50, 2062–2090. https://doi.org/10.1002/berj.4014
- Colognesi, S., Coppe, T., & Lucchini, S. (2023). Improving the oral language skills of elementary school students through video-recorded performances. Teaching and Teacher Education, 128, 104141.
- Colognesi, S., & Deschepper, C. (2019). Les pratiques déclarées de l’enseignement de l’oral au primaire. Qu’en est-il en Belgique francophone ? Language and Literacy, 21(1), 1-18.
- Colognesi, S., Moser, V., Deschepper, C., & Hanin, V. (2022). Bonne nouvelle : les enseignants du fondamental estiment qu’il est important d’enseigner l’oral en classe et se sentent compétents pour le faire! Mais certains ne le font quand même pas…. Veredas-Revista de Estudos Linguísticos, 26(1), 141-169
- Delcambre, I. (2011). Comment penser les relations oral/écrit dans un cadre scolaire. Recherches, 54(1), 7-15.
- Deschepper, C. (2021). Comment et pourquoi questionner les grilles d’évaluation de l’oral ? Description d’un dispositif de formation initiale et perspectives pour la recherche. Évaluer. Journal international de recherche en éducation et formation, 7(2), 61-78. https://doi.org/10.48782/e-jiref-7-2-61
- Di Cristo, A. (2013). La prosodie de la parole. De Boeck Supérieur.
- Di Cristo, A., Auran, C., Bertrand, R., Chanet, C., Portes, C., & Régnier, A. (2004). Outils prosodiques et analyse du discours. Cahiers de l’Institut de Linguistique de Louvain, 30, 27-84. https://hal.science/hal-00349856
- Dimmitt, C. (2009). Why evaluation matters: Determining effective school counseling practices. Professional School Counseling, 12(6), 395-399. https://journals.sagepub.com/doi/pdf/10.1177/2156759X0901200605
- Dobinson, K. L., & Dockrell, J. E. (2021). Universal strategies for the improvement of expressive language skills in the primary classroom: A systematic review. First Language, 41(5), 527-554. https://doi.org/10.1177/0142723721989471
- Dumais, C. (2016). Proposition d’une typologie des objets d’enseignement/apprentissage de l’oral. Les dossiers des sciences de l’éducation, 36, 37-56. https://doi.org/10.4000/dse.1347
- Gagnon, R., & Colognesi, S. (2021). Éditorial : Évaluer les performances orales sans les dénaturer ? Évaluer. Journal international de Recherche en Education et Formation, 7(2), 1-5. https://doi.org/10.48782/e-jiref-7-2-1
- Gagnon, R., de Pietro, J.-F., & Fisher, C. (2017). Introduction. Dans J. -F. de Pietro, C. Fisher et R. Gagnon (dir.), L’oral aujourd’hui : perspectives didactiques (p. 11-40). Presses universitaires de Namur.
- Garcia-Debanc, C. (1999). Évaluer l’oral. Pratiques, 103-104, 193-212.
- Gaudreau, G., Hudon, C., & Monetta, L. (2011). Bases psycholinguistiques et neuroanatomiques de la compréhension de l’ironie chez l’adulte. Revue de neuropsychologie, 3, 148-154. https://doi.org/10.3917/rne.033.0148
- Hadji, C. (1992). L’évaluation des actions éducatives. Presses Universitaires de France. https://doi.org/10.3917/puf.hadji.1992.01.
- Issaieva, É., & Crahay, M. (2010). Conceptions de l’évaluation scolaire des élèves et des enseignants : validation d’échelles et étude de leurs relations. Mesure et évaluation en éducation, 33(1), 31–61. https://doi.org/10.7202/1024925ar
- Kaldahl, A.-G. (2019). Assessing oracy: Chasing the teachers’ unspoken oracy construct across disciplines in the landscape between policy and freedom. L1-Educational Studies in Language and Literature, 19, 1-24. https://doi.org/10.17239/L1ESLL-2019.19.03.02
- Khabbazbashi, N., & Galaczi, E. D. (2020). A comparison of holistic, analytic, and part marking models in speaking assessment. Language Testing, 37(3), 333-360. https://doi.org/10.1177/0265532219898635
- Koo, T. K., & Li, M. Y. (2016). A guideline of selecting and reporting intraclass correlation coefficients for reliability research. Journal of Chiropractic Medicine, 15(2), 155-163. https://doi.org/10.1016/j.jcm.2016.02.012
- Lafontaine, L., & Messier, G. (2009). Les représentations de l’enseignement et de l’évaluation de l’oral chez des enseignants et des élèves du secondaire en français langue d’enseignement. Revue du Nouvel-Ontario, 34, 119-144.
- Lafontaine, L., & Préfontaine, C. (2007). Modèle didactique descriptif de la production orale en classe de français langue première au secondaire. Revue des sciences de l’éducation, 33(1), 47–66. https://doi.org/10.7202/016188ar
- Landrieu, Y., De Smedt, F., Van Keer, H., & De Wever, B. (2022). Assessing the quality of argumentative texts: Examining the general agreement between different rating procedures and exploring inferences of (dis) agreement cases. Frontiers in Education, 7. https://doi.org/10.3389/feduc.2022.784261
- Lavoie, C., & Bouchard, É. (2017). Formation universitaire à l’évaluation de l’oral : regard sur la capacité d’autoévaluation de futurs enseignants. Dans J. -F., De Pietro, C. Fisher, & R. Gagnon (dir.), L’oral aujourd’hui : perspectives didactiques (p. 259-274.). Presses universitaires de Namur.
- Mercer, N., Warwick, P., & Ahmed, A. (2017). An oracy assessment toolkit: Linking research and development in the assessment of students’ spoken language skills at age 11-12. Learning and Instruction, 48(1), 51-60. https://doi.org/10.1016/j.learninstruc.2016.10.005
- Metruk, R. (2018). Comparing holistic and analytic ways of scoring in the assessment of speaking skills. Journal of Teaching English for Specific and Academic Purposes, 6(1), 179-189. https://doi.org/10.22190/JTESAP1801179M
- Moncarey, C., Deschepper, C., Hanin, V., Van Mosnenck, S., Oliveri, S., & Colognesi, S. (2025). Les croyances des formateurs de futurs enseignants : influences sur leurs pratiques d’enseignement et d’évaluation de l’oral. Phronesis, 14(1), 117–137. https://doi.org/10.7202/1116127ar
- Nonnon, É. (2016). 40 ans de discours sur l’enseignement de l’oral : la didactique face à ses questions. Pratiques, 169-170. https://doi.org/10.4000/pratiques.3115
- Ounis, M. (2017). A comparison between holistic and analytic assessment of speaking. Journal of Language Teaching and Research, 8(4), 679. http://dx.doi.org/10.17507/jltr.0804.06
- Pinard-Prévost, G. (2009). Un consensus terminologique en prosodie ? Actes des XXIIIe journées de la linguistique (JDL), 5-6. 77
- Poiré, F. (2000). L’accent focal et l’accent d’emphase dans la description de l’intonation du français. Canadian Journal of Linguistics/Revue Canadienne De Linguistique, 45(3-4), 275-302. https://doi.org/10.1017/S0008413100017710
- Pollitt, A. (2012). The method of Adaptive Comparative Judgement. Assessment in Education: Principles, Policy & Practice, 19, 281–300. http://dx.doi.org/10.1080/0969594X.2012.665354
- Reddy, M. Y. (2011). Design and development of rubrics to improve assessment outcomes: A pilot study in a Master’s level business program in India. Quality assurance in education, 19(1), 84-104. DOI 10.1108/09684881111107771
- Sales-Hitier, D., & Dupont, P. (2025). Une évaluation pour soutenir l’enseignement et les apprentissages de l’oral : le dispositif SEMO. Phronesis, 14(1), 71–94. https://doi.org/10.7202/1116125ar
- Schwarz, N., Knäuper, B., Oyserman, D., & Stich, C. (2008). The psychology of asking questions. International Handbook of Survey Methodology, 18-34.
- Sénéchal, K. (2020). Repenser le modèle de la séquence didactique pour enseigner l’oral au primaire : résultats d’une première année de recherche. Recherches, 73, 7592.
- Stordeur, M. F., Nils, F., & Colognesi, S. (2021). Sept dilemmes rencontrés par les enseignants du primaire quand ils évaluent les exposés oraux des élèves. e-JIREF, 7(2), 7-37.
- Stordeur, M. F., Nils, F., & Colognesi, S. (2022). No, an oral presentation is not just something you prepare at home! Elementary teachers’ practices supporting preparation of oral presentations. L1-Educational Studies in Language and Literature, 22, 1-29.
- Stordeur, M.-F., Nils, F., Francotte, È., & Colognesi, S. (2025). Le pari de l’utilisation des auto-confrontations pour accompagner les élèves du primaire dans la production d’exposés oraux. Phronesis, 14(1), 215–241. https://doi.org/10.7202/1116132ar
- Thurstone, L. L. (1927). A law of comparative judgment. Psychological review, 34(4), 273. https://doi.org/10.1037/h0070288
- Tsai, Y-C., Chien, T-W., Wu, J-W., & Lin, C-H. (2022). Using the Alluvial plot to visualize the network characteristics of 100 top-cited articles on attention- deficit/hyperactivity disorder (ADHD) since 2011: bibliometric analysis. Medicine, 101(37), 1-11. http://dx.doi.org/10.1097/MD.0000000000030545
- van Daal, T., Lesterhuis, M., Coertjens, L., Donche, V., & De Maeyer, S. (2016). Validity of comparative judgement to assess academic writing: examining implications of its holistic character and building on a shared consensus. Assessment in Education: Principles, Policy & Practice, 26(1), 59–74. https://doi.org/10.1080/0969594X.2016.1253542
- Vassart, C., Blondeau, B., & Colognesi, S. (2022). Dans les coulisses de l’évaluation de l’oral par les pairs au primaire. Éducation et francophonie, 50(1).
- Verschueren, J. (1999). Understanding pragmatics. Edward Arnold.
- Weber, C. (2021). Oral, évaluation et réflexivité. Vers un mode intégratif des traits d’oralité. Évaluer. Journal international de recherche en éducation et formation, 7(2), 79-94. https://doi.org/10.48782/e-jiref-7-2-79
- Wells, B., Peppé, S., & Goulandris, N. (2004). Intonation development from five to thirteen. Journal of Child Language, 31(4), 749-778. https://doi.org/10.1017/S030500090400652X
- Wiertz, C. (2024). Le résumé d’informations à l’oral : démarche empirique de sa caractérisation via l’élaboration d’un outil de mesure [Thèse de doctorat inédite, Université catholique de Louvain].
- Wiertz, C., Blondeau, B., Francotte, E., Galand, B., & Colognesi, S. (2022). Utiliser une grille critériée pour évaluer les explications orales de ses pairs : quels fonctionnements et quels effets ? e-JIREF, 8(2), 51-88. https://doi.org/10.48782/m3kwdh11
- Wiertz, C., Coppe, T., Galand, B., & Colognesi, S. (soumis). Bridging the Gap in Oral Language Assessment: ORAToR, a Comprehensive Tool for Measuring Oral Summarization Competence.
- Wiertz, C., Galand, B., & Colognesi, S. (2025). « Dis-moi tout ce que tu sais sur… » : demander aux élèves du primaire de résumer oralement n’est pas si simple, même avec un appui documentaire. Phronesis, 14(1), 158–180. https://doi.org/10.7202/1116129ar
- Wiertz, C., Van Mosnenck, S., Galand, B., & Colognesi, S. (2020). Évaluer l’oral quand on est enseignant ou chercheur : points de discussion et prises de décision dans la coconception d’une grille critériée. Mesure et Évaluation en Éducation, 43(3), 1-37.
- Wurth, J. G. R., Tigelaar, E. H., Hulshof, H., De Jong, J. C., & Admiraal, W. F. (2022). Teacher and student perceptions of L1-oral language lessons in Dutch secondary education. L1-Educational Studies in Language and Literature, 20, 1-27. https://doi.org/10.21248/l1esll.2022.22.1.376

