Accueil > Actualités > Le Cycle BCL > Corpus d’apprenants : développement d’un schéma de métadonnées standardisées et propositions pour enrichir les corpus existants avec une information fiable de compétence langagière

Cycle BCL - Magali Paquot (FNRS – UCLouvain)

Corpus d’apprenants : développement d’un schéma de métadonnées standardisées et propositions pour enrichir les corpus existants avec une information fiable de compétence langagière

Jeudi 03 novembre - 10h - Salle Plate - Campus SJA3

Abstract

La communication a pour objectif de présenter deux projets de recherche en cours qui portent sur l’amélioration et l’enrichissement des corpus d’apprenants.

Le premier projet porte sur la nécessité pour le domaine de la recherche sur corpus d’apprenants de rendre les corpus d’apprenants plus facilement accessibles, interopérables et réutilisables (principes FAIR) et d’augmenter l’interprétabilité et la comparabilité des résultats de recherche (Granger & Paquot, 2017 ; König et al., 2022). Une première étape pour remplir cet objectif consiste en le développement d’un schéma de métadonnées standardisées qui pourrait être utilisé par la communauté scientifique pour décrire les corpus existants et guider la collecte de nouvelles données (Granger & Paquot, 2017 ; König et al., 2022).

Le deuxième projet entend répondre – au moins partiellement – à un défi pour le domaine, à savoir l’absence fréquente d’une information fiable sur la compétence langagière des apprenants dans les corpus d’apprenants disponibles aujourd’hui. Le projet a pour objectif d’évaluer la technique du Jugement Comparatif (Thurstone, 1927 ; Lesterhuis et al., 2016), couplée à du crowdsourcing, pour enrichir des corpus d’apprenants tels que l’International Corpus of Learner English (Granger et al., 2020) avec une mesure de compétence langagière fiable et valide des productions écrites des apprenants (voir Paquot et al., 2022 pour une première étude pilote).

Références

Granger, S., M. Dupont, F. Meunier, H. Naets, & Paquot, M. (2020). The International Corpus of Learner English (version 3). Louvain-la-Neuve : Presses universitaires de Louvain.

Granger, S. & Paquot, M. (2017). Towards standardization of metadata for L2 corpora. Invited talk at the CLARIN workshop on Interoperability of Second Language Resources and Tools, 6-8 December 2017, University of Gothenburg, Sweden.

König, A., Frey J.-C., Stemle, E., Glaznieks, A. & Paquot, M. (2022). Towards standardizing LCR metadata. Paper presented at Learner Corpus Research 6, 22-24 September 2022, University of Padua, Italy.

Lesterhuis, M., Verhavert, S., Coertjens, L., Donche, V., & De Maeyer, S. (2016). Comparative judgement as a promising alternative to score competences. In E. Cano & G. Ion (Éds.), Innovative Practices for Higher Education Assessment and Measurement (p. 119‑138). IGI Global. https://doi.org/10.4018/978-1-5225-0531-0.ch007

Paquot, M., Rubin, R. & Vandeweerd, N. (2022). Crowdsourced Adaptive Comparative Judgment : A community-based solution for proficiency rating. Language Learning 72(3), 853-885. https://onlinelibrary.wiley.com/doi/10.1111/lang.12498

Thurstone, L. L. (1927). A law of comparative judgment. Psychological Review, 34(4), 273‑286. https://doi.org/10.1037/h0070288

publié par Morgane Ftaïta le