ECTS
13 crédits
Code Apogée
1MNIU1
Composante(s)
UFR Langues et Civilisations
Période de l'année
Semestre 1
Liste des enseignements
Description du français contemporain à l'aide de corpus
Théories et modèles en syntaxe et en phonologie
5 créditsLinguistique de corpus et traitement syntaxique
Description du français contemporain à l'aide de corpus
Composante(s)
UFR Langues et Civilisations
Période de l'année
Semestre 2
L'objectif du cours est de proposer une réflexion sur le français contemporain notamment oral, en proposant une description linguistique de ses spécificités et en montrant différents modèles d'analyse, basés sur des corpus déjà existants (corpus de l'enseignant ou corpus en ligne). Pour les étudiants du Master SDL, c'est l'occasion de prendre un peu de recul par rapport aux théories linguistiques basées sur l’écrit et sensibiliser les étudiants aux usages et variations linguistiques souvent peu observés dans la littérature.
Théories et modèles en syntaxe et en phonologie
ECTS
5 crédits
Composante(s)
UFR Langues et Civilisations
Période de l'année
Semestre 2
Ce cours fait écho au séminaire optionnel du semestre 1 "Théories et modèles linguistiques" qui a, lui, pour objectif général de fournir une base solide de réflexion sur la linguistique théorique en adoptant une approche comparative des modèles proposés dans ce domaine. L’intérêt du cours "Théories et Modèles en Syntaxe et en Phonologie" est de centrer cette réflexion sur les deux domaines en question.
En ce qui concerne la syntaxe, il s’agira de comparer différentes conceptions à partir de l’étude des constructions dites partagées, cas où une suite de mots semble pouvoir occuper deux fonctions syntaxiques simultanément (ex : Nicolas adore, mais Joan déteste les sucettes ; avec les sucettes occupant deux fonctions d’objet direct). Ces constructions posent de nombreuses questions quant au fonctionnement général de la syntaxe des langues naturelles, et nécessite de mieux comprendre le fonctionnement de la coordination, de l’ellipse, mais aussi de l’interaction entre syntaxe et prosodie d’une part, et syntaxe et structure informationnelle/discursive d’autre part. Nous présenterons donc dans ce cours différentes approches ou formalisations possibles de ces constructions syntaxiques particulières.
La partie dédiée à la phonologie s'attachera à présenter aux étudiants un panorama général des conceptions et des modèles théoriques phonologiques dominants aux XX et XXIèmes siècles: structuralisme, fonctionnalisme, générativisme, phonologie non-linéaire, géométrie des traits, théorie de l'optimalité, en les mettant en perspective par rapport aux principales unités classiques de la phonologie: traits distinctifs, phonèmes, mores, syllabes, pieds, etc. Les études de cas et les exercices seront tirés de langues diverses et auront pour objectif d'illustrer les différentes approches théoriques et formelles de la phonologie au cours des 100 dernières années.
Linguistique de corpus et traitement syntaxique
Composante(s)
UFR Langues et Civilisations
Période de l'année
Semestre 2
Les manipulations des données et la réalisation des travaux pratiques seront effectuées à l’aide du langage de programmation Python. Pour faciliter le déroulement du cours les étudiants sont demandés de suivre le cours ‘Linguistique informatique : lexique’ (5LNSE32) de Licence3 SDL au premier semestre (contactez Mme Anna Kupsc pour les détails) ou les tutoriels ci-dessous avant le début du cours.
La première partie du cours portera sur la collecte de données massives à partir du web (ang. Web scraping). Ce dispositif peut être appliqué par l'étudiant pour constituer son propre corpus ou bien pour récolter des données ciblées (ex. trouver des définitions dans un dictionnaire en ligne ou chercher des exemples dans les documents structurés).
La suite du cours se focalisera sur des traitements automatiques de données textuelles. Nous allons montrer des outils de catégorisation automatique de mots (ang. part of speech tagging), lemmatisation, troncation (ang. stemming) et d’analyse syntaxique. Nous allons discuter comment ces outils permettent de réaliser une étude linguistique de données langagières.