Corpus parallèles, corpus comparables : quels contrastes ?
Résumé : Cette synthèse porte sur l’exploration des corpus multilingues dans une perspective de linguistique de corpus outillée, en faisant intervenir des techniques de traitement automatique des langues : nous nous intéressons d’abord aux corpus parallèles alignés, puis aux corpus dits comparables, afin d’en montrer les spécificités et la complémentarité. Dans une première partie, nous revenons à nos recherches sur l’alignement phrastique, et développons une méthode originale de multi-alignement, afin d’illustrer l’idée des faisceaux de correspondances inhérents à la multi-textualité. Nous étudions ensuite les différents types de contrastes que les corpus parallèles peuvent révéler, notamment au plan lexical, qu’on les [...]