The corpus in language sciences, a place for verifying language issues

Authors

DOI:

https://doi.org/10.18778/2392-0718.12.02

Keywords:

corpus, language sciences, choice and limits, homogeneity and representativeness, reliability

Abstract

The subject of the article addresses the question of corpus in language sciences. It highlights the main aspects relating to the constitution of a well-considered corpus to serve as a theoretical basis. This presentation is a synthesis of approaches allowing beginning researchers to constitute, delimit and explore certain aspects of language in order to launch well-founded scientific research. It shows that the results of research in language sciences should be drawn from the tangible data of a corpus before formulating any new theory, invalidating or calling into question another. The material in terms of content calls upon the opinions of corpus specialists with regard to the assigned definitions, the role of corpus for linguistic studies, its choice, its delimitation, its homogeneity, its representativeness, the nature of its components and its constraints. This article gradually shows the main facets to take into account in the constitution of the corpus in order to allow researchers to guarantee the reliability of the results.

References

ADAM, J.-M. & VIPREY J.-M. (2009). Corpus de textes, textes en corpus. Problématique et présentation. Corpus, 8, pp. 5-25. DOI: https://doi.org/10.4000/corpus.1672

BRONCKART, J.-P. (2008). Genres de textes, types de discours et degrés de langue. Hommage à François Rastier. Texto [en ligne]. Dialogues et débats. URL : https://www.revue-texto.net/index.php?id=86

CAPT,V., JACQUIN, J. & MICHELI, R. (2009). Les sphères de contextualisation. Réflexion méthodologique sur les passages de texte à texte(s) et la constitution des corpus. Corpus, 8, pp. 129-147. DOI: https://doi.org/10.4000/corpus.1685

CHARAUDEAU, P. (2009). Dis-moi quel est ton corpus, je te dirai quelle est ta problématique. Corpus, 8, pp. 37-66. DOI: https://doi.org/10.4000/corpus.1674

CISLARU, G., SITRI, F. (2012). De l’émergence à l’impact social des discours : hétérogénéités d’un corpus. Langages, Armand Colin, pp.59-72. DOI: https://doi.org/10.3917/lang.187.0059

CNRTL (Centre National des Ressources Textuelles et Lexicales). https://www.cnrtl.fr/definition/corpus [7/05/2021].

COMBY, É., MOSSET, Y. (2016). Le corpus à l’interface des humanités et des sciences sociales. Dans Corpus de textes : composer, mesurer, interpréter. Lyon : ENS Éditions. http://books.openedition.org/enseditions/7341 DOI : https://doi.org/10.4000/books.enseditions.7341 DOI: https://doi.org/10.4000/books.enseditions.7341

DALBERA, J-P. (2002). Le corpus entre données, analyse et théorie. Corpus, 1. http://journals.openedition.org/corpus/10 ; DOI : https://doi.org/10.4000/corpus.10 DOI: https://doi.org/10.4000/corpus.10

GARRIC, N. (2012). Construire et maîtriser l’hétérogénéité par la variation des données, des corpus et des méthodes. Langages 3,187, pp. 73-92. DOI : 10.3917/lang.187.0073 DOI: https://doi.org/10.3917/lang.187.0073

HABERT, B. (2000). Des corpus représentatifs : de quoi, pour quoi, comment ? In BILGER, M., editor, Linguistique sur corpus. Études et réflexions, number 31 in Cahiers de l’université de Perpignan, pp. 11-58. Perpignan : Presses Universitaires de Perpignan.

LE PETIT ROBERT. DICTIONNAIRE ALPHABETIQUE ET ANALOGIQUE DE LA LANGUE FRANÇAISE(1989). dirigé par Alain Rey et Josette Rey-Debove. Paris : Société du Nouveau Littré/Le Robert.

MAGNANI, E. (2017). Qu’est-ce qu’un corpus ? Compte-rendu de la journée d’études. https://irht.hypotheses.org/3187 [18/04/2021].

MAYAFFRE, D. (2002). Les corpus réflexifs : entre architextualité et hypertextualité. Corpus, 1. http://corpus.revues.org/11 ; DOI : https://doi.org/10.4000/corpus.11 DOI: https://doi.org/10.4000/corpus.11

MAYAFFRE, D. (2010). Vers une herméneutique matérielle numérique. Corpus textuels, Logométrie et Langage politique, mémoire pour l’Habilitation à diriger des recherches, Université Nice-Sophia Antipolis. http://tel.archives-ouvertes.fr/tel-00655380 [28/09/2017].

MELLET,S.(2002). Corpus et recherches linguistiques. Corpus, 1. http://journals.openedition.org/corpus/7 ; DOI : https://doi.org/10.4000/corpus.7 DOI: https://doi.org/10.4000/corpus.7

MOIRAND, S. (2018). L’apport de petits corpus à la compréhension des faits d’actualité. Corpus, 18. http://journals.openedition.org/corpus/3519 ; DOI : https://doi.org/10.4000/corpus.3519 DOI: https://doi.org/10.4000/corpus.3519

PINCEMIN, B. (2012). Hétérogénéité des corpus et textométrie. Langages, 187, pp. 13-26. DOI : https://doi.org/10.3917/lang.187.0013 DOI: https://doi.org/10.3917/lang.187.0013

RASTIER, F. (2004). Enjeux épistémologiques de la linguistique de corpus. Texto ! http://www.revue-texto.net/1996-2007/Inedits/Rastier/Rastier_Enjeux.html [10/09/2021].

RASTIER, F. (2005). Enjeux épistémologiques de la linguistique de corpus. In WILLIAMS, G. (éd.). La linguistique de corpus. Rennes : Presses Universitaires de Rennes, pp. 31-45.

TOGNINI-BONELLI, E. (2001). Corpus Linguistics at Work. Studies in corpus linguistics, 6. https://irht.hypotheses.org/3187#identifier_3_3187 [11/02/2021]. DOI: https://doi.org/10.1075/scl.6

TREFFORT, C. (2014). Le corpus du chercheur, une quête de l’impossible ? Quelques considérations introductives. Le corpus. Son contour, ses limites et sa cohérence, Annales de Janua, Actes des Journées d’études. http://annalesdejanua.edel.univ-poitiers.fr/index.php?id=725 [28/07/2021].

VETULANI, G. (2000).Quelques exemples d’analyse des corpus en vue de la traduction. Studia Romanica Posnaniensia, 25/26, pp. 317-325. DOI: https://doi.org/10.14746/strop.2000.2526.029

Downloads

Published

2024-10-30

Issue

Section

Articles

How to Cite

Ferhat, Salem. 2024. “The Corpus in Language Sciences, a Place for Verifying Language Issues”. E-Scripta Romanica 12 (October): 11-27. https://doi.org/10.18778/2392-0718.12.02.