Constitution d’un corpus : 1) métadonnées, 2) critères
de sélection des textes et 3) normes
linguistiques
d'annotation.
- Définition d'un corpus électronique,
- Typologies des corpus : monolingues, bilingues, etc.
- Corpus de références
- Contraintes de constitution d'un corpus : domaines, genres, situation de discours
- Metadonnées : DublinCore CES TEI OLAP
- Mesures d'évaluation intrinsèque et extrinsèque de la qualité du corpus
- Annotation : mesurer la complexité de l’annotation
- Codage de la parole, préparée ou conversationnelle
- Appréhender les outils d’annotation (transcriber, Webanno)
- Guide d’annotations