Numéro |
HEL
Volume 38, Numéro 2, 2016
Constitution de corpus linguistiques et pérennisation des données
|
|
---|---|---|
Page(s) | 9 - 21 | |
DOI | https://doi.org/10.1051/hel/2016380202 | |
Publié en ligne | 1 février 2017 |
La constitution d’un corpus de geordie parlé : choix épistémologiques et réalisations empiriques. Retour sur un demi-siècle de sociophonétique anglaise
Université Paris Diderot, Sorbonne Paris Cité / Université de Newcastle
Cet article traite de la constitution d’un corpus parlé de l’anglais du Tyneside (plus connu sous le nom de Geordie) ou Diachronie Electronic Corpus of Tyneside English (DECTE, Corrigan et al. 2010-2012). Ce dernier consigne près de cinquante ans de recherche en linguistique de corpus. À la fin des années soixante, au moment où débute l’enquête linguistique du Tyneside (ou TLS), deux enquêtes linguistiques s’achèvent. L’une en Grande-Bretagne, l’autre aux États-Unis. Or, si Labov recommandait le recours à un nombre limité de variables lors d’études de données linguistiques, la TLS avait pour but original d’inclure le maximum de variables afin de permettre des analyses plus précises sur des données plus conséquentes grâce aux nouveaux outils informatiques à la disposition des chercheurs (Pellowe et al. 1972, Jones-Sargent 1983). Lors de la conception de l’enquête TLS, la possibilité de traitement par la machine avait toute son importance. Après une présentation de l’école anglaise en dialectologie, souvent promue par les universités du nord de l’Angleterre (malgré un grand nombre d’études sur les dialectes dans les années 1970), nous traitons de la particularité des approches méthodologiques du DECTE, des projets à la fois de conservation des données afin de numériser des enregistrements jusqu’alors sur bande magnétique, et de diffusion auprès du grand public.
Abstract
This paper investigates the creation of the Diachronic Electronic Corpus of Tyneside English (henceforth, DECTE, Corrigan et al. 2010-2012) a spoken corpus of Tyneside English, more commonly known as Geordie English. It comprises more than fifty years of research in corpus linguistics. At the end of the 1960s, as the Tyneside Linguistic Survey (henceforth TLS) was about to start, two linguistic surveys had just been completed, the former in Great-Britain and the other one, in the USA. But while Labov recommended the use of a smaller number of variables in the study of linguistic data, the TLS’s original aim was to use as many variables as possible so as to enable more detailed analyses on bigger data thanks to the new computing tools that were increasingly available for research (Pellowe et al. 1972, Jones-Sargent 1983) and to make it machine-readable. After an overview of the English school of dialectology, often propelled by northern universities (despite a great number of studies on southern dialects in the 1970s), we highlight the specificities of DECTE regarding its methodological approaches, the various preservation projects to transfer the sounds from magnetic tapes to digital files along with their accessibility to the community of linguistics as well as to the public.
Mots clés : dialectologie anglaise / corpus oraux / anglais de Tyneside / Geordie / sociophonétique / dialectologie urbaine
Key words: English dialectology / spoken corpora / Tyneside English / Geordie English / sociophonetics / urban dialectology
© SHESL/EDP Sciences, 2016