Harmonisation/standardisation des méthodes de traitement de corpus écrits de type SMS. Anonymisation, transcodage, annotation.
Journées d’étude : Harmonisation/standardisation des méthodes de traitement de corpus écrits de type SMS. Anonymisation, transcodage, annotation.
14 et 15 novembre, MSH-M, Salle de séminaire.
14h-14h15 : Accueil
14h15-14h30 : Présentation des exemples (Rachel Panckhurst)
14h30-15h30 : Transcodage : tour de table.
16h-17h : Transcodage (suite) et annotation.
9h-9h15 : Accueil par Rachel Panckhurst.
9h15-10h : Cédrick Fairon, Professeur, Directeur du CENTAL, Centre de traitement automatique du langage, Université catholique de Louvain, Belgique, « Apports du corpus SMS4science : de la correction/normalisation de SMS à la compression de texte ». Cette intervention sera en présence de l’orateur.
10h-10h15 : Discussion
10h45-11h30 : Christian Guilbault, Assistant Professor, Department of French, Simon Fraser University, Vancouver ; Patrick Drouin, Professeur agrégé (TAL), Université de Montréal : Textos au Canada : encodage, analyses en cours et analyses projetées. Cette intervention sera en présence de Christian Guilbault.
11h30-12h : Discussion
12h-12h15 : Clôture du séminaire.
14h15-14h30 : Compte rendu de la réunion TGE-Adonis à Paris (Rachel Panckhurst)
14h30-15h30 : Anonymisation des SMS bruts et diffusion du corpus (nous avons invité Nicolas Hvoinsky, SAJI, UPV, pour les aspects légaux)
15h45-16h45 : Synthèse des travaux, insertion dans différents projets (« Corpus écrits », TGE-Adonis, etc.)
16h45-17h : Clôture des journées.
Dans la même rubrique :