Mulce : Échange de corpus d'apprentissage multimodaux

Le projet MULCE est soutenu par le programme « Corpus et outils de la recherche en sciences humaines et sociales» de l’Agence Nationale de la Recherche en France (2007-2010).







Nous proposons la création et la diffusion de corpus d'apprentissage. Cet ensemble de données doit rassembler, non seulement les données résultats d'une formation mais également son contexte, c'est-à-dire les données caractérisant le dispositif de formation, ainsi que celles provenant du dispositif de recherche

La constitution de corpus d'apprentissage n'a d'intérêt que si ceux-ci peuvent faire l'objet d'échanges entre les communautés de chercheurs, ce qui oblige à : 1) les structurer et les formater suivant un modèle (à inventer) compatible avec les standards existants pour les corpus et les langages de conception pédagogique ; 2) les déposer sur un serveur répondant aux principes d'interopérabilité et d'accès libre ; 3) élaborer une charte éthique (car nous travaillons sur des productions d'individus) et des contrats de cession des droits et d'utilisation en rapport.

Mais faire du corpus d'apprentissage un objet d'études scientifiques nécessite aussi de le doter d'une méthodologie d'exploitation en rapport. C'est pourquoi une partie du projet Mulce s'intéresse à toute la chaîne de traitement, retranscription, annotations, étiquetages, analyses, et aux outils associés. Les résultats des traitements successifs doivent bien sûr ajouter des niveaux de descriptions complémentaires au corpus d'origine.

En savoir plus : http://mulce.org