Journée d'étude en linguistique
La journée d'étude abordera la question de la méthodologie dans les (sous)-disciplines linguistiques où l'empirie est renouvelée par les nouvelles technologies. Cette méthodologie satisfait-elle aux exigences de rigueur établies par une longue tradition, qu'il s'agisse de la tradition philologique ou de la tradition sociolinguistique, avec l'objet desquelles les données et corpus d'internet peuvent être comparés ? On constate le plus souvent que les métadonnées (conditions de constitution des corpus ou du recueil des données, information sur les locuteurs/scripteurs, éléments de contextualisation, statut discursif, diatopique, diastratique, diaphasique, diamésique et sociolinguistique en général) sont inexistantes (cf. Dublin Core, Text Encoding Initiative). D'autre part, l'exigence de diversification des sources, de leur comparabilité relativement à la sélection et à la taille des corpus/échantillons ou à la fréquence (relative ou absolue) des unités, par exemple, le codage des corpus, leur annotation (souvent manquante, même au niveau morphosyntaxique) et le contrôle de la qualité de ces traitements, semblent peu problématisés. Enfin, on ne dispose pas d'inventaire standard des outils descriptifs et analytiques (par ex. les différents types de mesures) disponibles pour interroger ces ressources digitales.
Le problème de la méthodologie, et par conséquent celui des conditions de validation à l'aide de ces données, concerne aussi bien les ressources fournies par les nouvelles technologies que les outils de traitement utilisés. Certaines sous-disciplines de la linguistique, telle la psycholinguistique de l'acquisition dont l'approche a été entièrement renouvelée par les techniques numériques, mettent la méthodologie quantitative au centre de la recherche et de l'argumentation. Font-elles alors figure de précurseur ? Préfigurent-elles le devenir de la linguistique, voire des sciences humaines dans leur ensemble ? Un nouveau standard méthodologique est-il en train d'émerger et rendra-t-il caduques les recherches sans base empirique numérisée et sans outillage informatique ?
La journée réunira des chercheurs d'horizons théoriques différents et confrontera leurs approches.
Programme de la journée:
9h15 - 9h30: Ouverture
9h30 - 10h30: Steven Gillis (Université d'Anvers), The use of speech corpora for language acquisition research
10h30 - 10h45: Pause café
10h45 - 11h45: Mirjam Ernestus (Université Radboud de Nimègue), The use of speech corpora for (psycho)linguistic research
11h45 - 12h45: Gilles Boyé (Université Michel de Montaigne - Bordeaux 3), A data-driven analysis of French verb inflection: driving around the curbs
13h - 14h15: Repas
14h30 - 15h30: Nabil Hathout (Université de Toulouse II - Le Mirail), New practices and new models in morphology
15h30 - 16h30: Elena Tribushinina & Pim Mak (Université d'Utrecht), What speech production corpora cannot tell us: Insights from eye-tracking in research on bilingualism and SLI (specific language impairment)
16h30: Clôture