Master Lexicographie, Terminographie et Traitement Automatique des Corpus (Master LTTAC)
Je suis intervenu de 2012 à 2026 pour des cours communs en :
- le Master LTTAC (Lexicographie, Terminographie et Traitement Automatique des Corpus),
- le Master EdNITL (Éditions numériques et imprimées de textes littéraires) qui se poursuit aujourd'hui,
- le Master LCE (Littératures et cultures européennes).
À propos du Master LTTAC : un article de la RTBF qui évoque le métier de lexicographe et la formation.
Semaine intensive de mises à niveau
Semaine intensive de mise à niveau pour les nouveaux étudiants avec un cours d'algorithmique et un cours de HTML & CSS.
Voir un cours équivalent maintenant donné dans les Masters de la Faculté des Humanités de Lille.
Programmation Perl en première année
Présentation du cours perl
Cet enseignement proposait une découverte de la programmation avec le langage Perl et une introduction à la manipulation de corpus textuels.
Perl a été créé en 1987 par Larry Wall. Linguiste de formation, il visait dès l'origine un langage de programmation facilitant le traitement des données textuelles. Larry Wall a également voulu que Perl présente de nombreux points communs avec le langage naturel. Par la suite, et outre ces premières caractéristiques, Perl a été utilisé comme un langage glu, c'est-à-dire permettant des changements de formats et facilitant ainsi le dialogue entre des logiciels basés sur des dialectes différents.
Aujourd'hui, Perl est largement répandu et présent sur différentes plates-formes. Il a connu un regain d'intérêt avec l'apparition de nouvelles problématiques tels l'exploration du web caché, le big data et l'open data, et de nouveaux métiers comme data journalist.
Dans le cadre de ce cours nous privilégierons le travail sous Linux, sans que cela soit obligatoire. Tous les supports (notes de cours, feuilles d'exercices, etc.) seront disponibles en ligne et donc accessibles à distance.
Le cours commencera par une mise à niveau sur le système d'exploitation Linux, puis passera en revue les sujets suivants :
- codages des caractères et formats de documents,
- mise en œuvre en Perl du cours d'algorithmique et production automatique de textes,
- expressions régulières en perl et extractions automatiques à partir de textes.
Des réalisations concrètes accompagneront le cours :
- cryptage et décryptage de messages,
- découverte d'anagrammes et jeu de scrabble,
- corrections orthographiques et aide à l'écriture,
- calcul de co-occurrences et concordancier,
- constitution automatique de corpus à partir du web,
- classification automatique de textes, etc.
Cette liste pourra être modifiée et enrichie à l'initiative des étudiants.
Références bibliographiques
Tanguy L., Hathout N. (2007) Perl pour les linguistes, Programmes en Perl pour l'exploitation des données langagières Science Publications, Éditions Hermès
Christiansen T., Foy B., Wall L., Orwant J. (2012) Programming Perl: Unmatched power for text processing and scripting O'Reilly
Éléments abordés dans le cours perl
- Systèmes d'exploitation Linux.
- Expressions régulières.
- Algorithmique.
- Langage Perl.
Programmation JavaScript en deuxième année
Cours de programmation JavaScript donné en deuxième année du master LTTAC.
Voir un cours équivalent maintenant donné dans les Masters de la Faculté des Humanités de Lille.
