Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
Repèresthéoriques:cadredisciplinaire
5.3.Delalinguistiquedecorpusverslalexicographiedecorpus
33
L’ensembledescontextesquicaractériseletermeestconstruitsurlabasedes
cooccurrencesdestermesrepéréesdansdestextesauthentiques.Laméthodede
modélisationdusensàpartirdescontextesdoitdoncreposersurl’analysedistri-
butionnelled’unensembledetextesd’unetailleassezélevée.Pourapporterune
caractéristiqueexhaustiveetfiable,ilestnécessairedefouillerdansuncorpus
quialecaractèred’uncorpusderéférence(engénéraloupourlesbesoinsdes
tâchesentreprises).
Bienqueladéfinitionintuitivedecorpusneposepasdeproblème-habi-
tuellementonentendparcetermeunensembleouunrecueildetextes-en
linguistique,lanotiondecorpusn’estpassiclaire.Laseulechosequenous
puissionssanshésitationajouteràcettedéfinition,c’estlaformeélectronique
ducorpus,parcequelalinguistiquedecorpusseplaceaujourd’huiauseinde
lalinguistiqueinformatique(cf.Lewandowska-Tomaszczyk,2005).
Danslalinguistiquedecorpus,ilexistedeuxorientationsprincipalesdere-
cherches(cf.TogniniBonelli,2010).Enpremierlieu,ilestpossibled’identifier
desapprochescorpusbasedquisefondentsurdesthéorieslinguistiquespré-
existantesets’appliquentafindelesvalider.Cesthéoriespréexistantesreposent
notammentsurdescritèresformelsconcernantlacompositiondescorpuseux-
mêmes,laquantitédestextesentrantdanslecorpus,leurqualitéetleurfor-
mat.Ensecondlieu,ilestpossiblededistinguerdesapprochescorpusdriven
quisupposentquelesphénomèneslinguistiquessemanifestentdanslescorpus
quijouentlerôlederessourcesdesdonnéeslinguistiques.Ensuite,cesdonnées
serventdebaseàdesanalyseslinguistiquesauseindediférentesapprochesmé-
thodologiques.End’autrestermes,lecorpusconstituelefondementdesétudes
descriptivesenlinguistiques.
Lecorpusquiestsourcededonnéespourdesrecherchesenlinguistique
peutêtreappelécorpuslinguistique.Danslecadredesapprochescorpusbased,
ilnepeutpass’agird’unensembledisparate.J.Sinclair(2005)définituncorpus
linguistiqueainsi:
acollectionofpiecesoflanguagetextinelectronicform,selectedaccordingto
externalcriteriatorepresent,asfaraspossible,alanguageorlanguagevariety
asasourceofdataforlinguisticresearch(Sinclair,2005:15)6.
Parconséquent,pourqu’unensembledetextespuisseêtrenommécorpus
linguistique,ildoitréunirlescritèressuivants:
6unecollectiondedonnéeslangagièressousformeélectronique,sélectionnéesselondes
critèresexternespourreprésenter,autantquepossible,unelangueouunevariantelinguistique,
quiestutiliséecommesourcededonnéespourlarecherchelinguistique[trad.K.G.].