Numéro |
HEL
Volume 38, Numéro 2, 2016
Constitution de corpus linguistiques et pérennisation des données
|
|
---|---|---|
Page(s) | 87 - 99 | |
DOI | https://doi.org/10.1051/hel/2016380207 | |
Publié en ligne | 1 février 2017 |
Une linguistique outillée, pour quels objets ?
Université Grenoble Alpes, UJF / LIDILEM
Nous prenons dans cet article le parti d’interroger non les apports des corpus en tant que tels à la recherche linguistique et à la constitution de nouveaux savoirs mais la nature des objets de recherche et le type de recherches induits par une linguistique de corpus, plus précisément une linguistique outillée. Nous défendons l’idée que l’outillage même de la linguistique oriente la recherche vers les formes, selon une approche sémasiologique. Toutefois, nombre de recherches en corpus visent à cerner les expressions linguistiques de certaines significations, selon une approche onomasiologique, tout en utilisant des outils et des apports du TAL pour ce faire. Nous en tirons des propositions méthodologiques pour accroitre la valeur scientifique des recherches.
Abstract
In this article, I question the relationship between corpus linguistics and the kind of research objects that a computer-based linguistics deals with. I try to show that using software to carry out linguistic investigations influences the kind of objects linguists are studying. Computers help to grab forms, so linguists tend to take forms as a point of departure and investigate their meaning(s). Another orientation exists, from meaning to the expressions that express this given meaning, and it may also use software tools. In this case, in order to limit subjectivity, I propose to adopt a methodology which combines a measure of judgments about the collected data and in-corpus annotation of the phenomena under study.
Mots clés : Approche onomasiologique / objets linguistiques / outils / méthodologie / TAL
Key words: Corpus linguistics / tools / methods / NLP
© SHESL/EDP Sciences, 2016