Didactique de corpus

Lexique 3 est une base de données qui fournit pour 135 000 mots du français: les représentations orthographiques et phonémiques, la syllabation, la catégorie grammaticale, le genre et le nombre, les fréquences, les lemmes associés, etc.

Autres bases: http://www.lexique.org/telAutresBases.php

Diphones 1.00 A French database of diphones positional frequency.
Morphalou2Lexique 1.00 Des scripts de conversion de Morphalou au format de Lexique 3.
Surface 2.10 Pour chaque mot sa fréquence moyenne de lettres, de bigrammes, de trigrammes, de phonèmes, et de syllabes.
Fréquences Frantext 1.10 Tous les mots non filtrés de Frantext et leurs fréquences brutes (sur 31 millions)
Voisins 1.02 Pour chaque mots, Voisins présente ses voisins ainsi que leur fréquence
Anagrammes 1.00 Pour chaque mot, Anagrammes présente tous ses anagrammes
Prénoms 1.00 Pour 11627 prénoms, Prénoms donne son sexe, sa langue d’utilisation et sa fréquence selon Frantext
Corpatext 1.02 Corpus de textes libre de 2700 textes et 37 millions de mots
Gougenheim 2.00 Fréquences orales et de production de 8774 mots
Graphies-Phonies 1.03 (règles de conversion graphèmes-phonèmes) Les graphies existantes pour chaque phonème de la langue française
Fréquence Phonèmes Diphones Triphones par Cédric Gendrot Les fréquences de phonèmes, diphones et triphones basé sur un corpus de 40 heures de parole journalistique (1 560 267 segments
Brulex fut la première base de données lexicales pour le français400images. Normes de fréquences, familiarité, age d’acquisition… pour 400 mots(plus d’info)
400AoA: Age d’acquisition pour 400 mots (plus d’info)
Fréq Sub et Imagerie: Valeur de fréquence subjective et d’imagerie pour 1916 substantifs (Desrochers et Bergeron; 2000) (plus d’info)

Le corpus LANCOM
https://halshs.archives-ouvertes.fr/halshs-00926904/document
http://bach.arts.kuleuven.be/elicop/

CORPUS ORAUX : RECUEIL ET ANALYSE DE DONNÉES, VERBUM,Tome XXX, N°4, 2008
Numéro coordonné par Jeanne-Marie Debaisieux, Tiphanie Bertin & Magali Husianycia
http://www.atilf.fr/spip.php?article3823

La variation et les corpus : une entrée méthodologique, avec l’exemple du style / Françoise Gadet

https://www.canal-u.tv/video/universite_toulouse_ii_le_mirail/la_variation_et_les_corpus_une_entree_methodologique_avec_l_exemple_du_style_francoise_gadet.13854

Projet PFC (phonologie du français contemporain)- Enseignement du français
http://www.projet-pfc.net/pfc-enseignement-du-francais.html

Exploration de corpus: outils et pratiques
http://explorationdecorpus.corpusecrits.huma-num.fr/

ESLO1 (1967-1971) et ESLO 2 (en cours): Enquête sociolinguistique à Orléans
Ce site met à votre disposition un corpus linguistique composé d’enregistrements sonores et de leurs transcriptions réalisés à Orléans entre 1968 et 1974 (ESLO1) et à partir de 2008 (ESLO2).
http://eslo.huma-num.fr/index.php/pagecorpus/pagepresentationcorpus
http://eslo.huma-num.fr/index.php/pagecorpus/pageaccescorpus

CRFC (corpus de référence du français contemporain): français de France d’environ 310 millions de mots, 14 genres discursifs.
http://www.projet-orfeo.fr/corpus/le-corpus-d-etude-du-francais-contemporain/14-orfeo 

Conférence des 3 et 4 février 2016 
Première partie:
Deuxième partie:

L’ouverture de ce corpus au grand public est prévue pour 2018. LINX 68-69, Corpus et apprentissage du FLE.