Travail à partir d'un corpus

1 - Le corpus linguistique est un échantillonnage. Il s'agit d'un ensemble de faits de langue destinés à l'observation et à l'analyse. Il pourra être en français ou en portugais, ou les deux à la fois pour une étude comparée de certains faits.

2 - Le corpus est constitué par des enregistrements transcrits, ou des prises de notes, ou des écrits publics ou privés divers, sur papier ou sur Internet, etc. Notez les façons étranges de parler, relevez tel ou tel emploi dans son entourage, relevez sur Internet des occurrences, dans les journaux, ou sur toute sorte de supports.

3 - Le corpus peut réunir des énoncés de diverses origines, de longueurs variées, de langues variées, selon le phénomène qu'on veut étudier.

4 - Démarche : cerner la nature d'un phénomène, l'interpréter (pourquoi, comment), faire des hypothèses, vérifier les hypothèses, formuler éventuellement une règle. La meilleure méthode est à la fois hypothético-déductive et empirico-inductive. On recherchera donc en premier ce qui nous semble subjectivement une anomalie, ou une curiosité, ou d'un intérêt subjectif, c'est le premier stade de l'analyse.

5 - L'esprit de ce travail sur un corpus doit être de tenter de trouver quelque chose de nouveau.

6 - Pour ce TD : 2 pages de corpus maximum, et 2 pages d'analyse et de commentaire maximum, le tout en format numérique. Prendre d'abord un corpus long qui sera réduit ensuite, veiller à la qualité (de l'enregistrement par exemple), à la fiabilité, à l'association de références précises. On peut prendre plusieurs idées au départ pour ne garder ensuite que celle qui semble la meilleure. On peut changer d'idée en cours de travail.

7 - Ce petit travail peut fort bien être le germe d'un futur mémoire ou d'une thèse. Mais il sera utile pour tout travail futur parce que tout travail demande la même rigueur. On doit s'appliquer à acquérir de la méthode, et choisir une question qui motive.

8 - Exemples de champs d'étude : les écarts en général, de prononciation (adtaleur, chuis, pa'empe, a'ec), de vocabulaire, de syntaxe (le livre que je t'ai parlé, un espèce de), mais aussi les formes normatives, les tics, les ruptures, les ellipses, les marques du temps, de l'espace, l'utilisation de superlatifs, de démonstratifs, les redondances, l'allocution, etc., les abréviations dans les sms, le langage enfantin, caractériser un idiolecte, etc.

9 - Le commentaire

  • Rassembler d'abord les observations avant de structurer le commentaire ;
  • Ne pas s'interdire des considérations sur le sens, sur le contenu ;
  • Consulter de la documentation qui traite des mêmes questions pour vous en inspirer : il faudra alors donner ces sources dans la bibliographie, à la fin du commentaire.
  • Pas de plan particulier à suivre : la structure de votre commentaire dépendra de ce que vous y dites.

10 - Où trouver les éléments du corpus ? Vous pouvez interviewer ou enregistrer des personnes. Vous avez aussi toute sorte de textes, mais on préfèrera les textes non littéraires, et récents. Par exemple, vous pouvez prendre comme corpus les forums des sites Lingalog et Galanet, une correspondance par e-mail, etc.

  • Pour copier un corpus sur www.lingalog.net, vous pouvez le faire par copier-coller, mais si vous y êtes inscrit, la plate-forme vous prépare un fichier imprimable ou sauvegardable pour chaque discussion : il suffit de cliquer sur le lien rouge “imprimer” en haut de la page.
  • Vous trouverez d'autres corpus de forums sur www.galanet.eu : pour y entrer cliquer sur le nom d'une session, puis sur “Visiteur”.

Soyez critiques sur ces consignes, elles seront clarifiées et complétées grâce à vos questions et à vos remarques.

Les critères d'évaluation :

  • le respect des consignes
  • la pertinence des observations
  • l'utilisation correcte des concepts du cours
  • autres ?

La date de remise du travail (19 décembre). Entre-temps, vous devez dialoguer avec l'enseignant, par mail de préférence (mcoelhof.lyon2@gmail.com) ou pendant les TD.