Dans le cadre du projet OUTILSNUM, workshop sur les utilisations de R pour les modèles LNRE (package {Zipf} )
Présentation du contenu
Formation compacte intense d’initiation au langage de programmation R à partir d’un script, application à un package spécifique conçu pour l’étude de la productivité des suffixes. La formation contient des cours et des travaux pratiques en alternance au cours de la journée. Des liens vers des ressources complémentaires pour approfondissement seront proposés, notamment les archives des concepteurs du package.
Mode de validation
Une attestation de présence sera délivrée à chaque étudiant ayant suivi l’ensemble de la formation. Un certificat de réussite sera délivré aux étudiants ayant passé avec succès le QCM et l’épreuve de validation.
Programme détaillé initiation à la logique des packages sous R. Présentation du package Zipf : modéliser la croissance des types en fonction de l’augmentation de la taille du corpus - Initiation aux modèles LNRE (Baroni & Evert 2006)
9h-12h le package zipfR (niveau I) comparer des corpus de corpus de taille différentes notion d’interpolation et d’extrapolation des données exemples de calcul de productivité lexicale pour des affixes
14h-18h le package zipfR (niveau II) initiation à la modélisation des données (loi de Zipf, modèles LNRE) importation de jeux de données/résultats de concordances propres initiation à la critique de modèles
Objectifs pédagogiques
Amener en peu de temps à savoir modéliser les courbes de croissance lexicales et la productivité des unités lexicales sous R à partir du package {zipfR}. Apprendre à s’approprier un package de R à partir de sa documentation. Comparer des corpus de tailles différentes.
Formateur
Nicolas Ballier est professeur de linguistique anglaise à Paris Diderot et pratique R depuis plus de trois ans. Il a notamment co-édité Automatic Treatment and Analysis of Learner Corpora chez Benjamins.
Pré-requis :
Savoir se servir de R et de son environnement RStudio.
Public visé:
Masterants de 2e année - Doctorants de 1ère, 2ème ou 3ème année - Disciplines : langues, linguistique
Directrice : Pr Natalie Kübler
Centre de Linguistique Inter-langues,
de Lexicologie, de Linguistique Anglaise
et de Corpus-Atelier de Recherche sur la Parole
EA 3967
8 place Paul Ricœur
75013 Paris
Case courrier 7002
5 rue Thomas Mann
75205 Paris cedex 13