- Opération 1. Echantillonnage des corpus (30 heures de parole)
- Opération 2. Prétraitement des corpus : alignement son-texte et extraction des contextes d’annotation
- Opération 3. Annotation prosodique (6 heures): marquage des proéminences et des frontières
- Opération 4. Annotation syntaxique (6 heures): dépendances, topologie
- Opération 5. Formats des rendus : Annotation intonosyntaxique, XML, TEI
- Opération 6. Outils de fouille : requêtes et visualisation des résultats
- Opération 7. Analyses linguistiques : expertise symbolique, apprentissage automatique
- Opérations 8. Délivrables : ressources logiciels, ressources linguistiques (données et métadonnées), démo d’outils
(synthèse IRCAM)