Mathieu Roche
CIRAD Research Scientist (PhD, HDR) in Computer Science
Content [Teaching]
Contact
-
UMR TETIS
AgroParisTech, Cirad, Cnrs, INRAe
500, rue J.F. Breton
34093 Montpellier Cedex 5, France
Fouille de Données / Data Mining (Masters IC and IPS)
COURS
Les supports de cours sont disponibles à l'adresse suivante : Enseignements ECD
L'emploi du temps est disponible sur le site du Master IC : EDT
TP
TP1 : Etiqueteur de Brill (1h30)
Enoncé du TP : pdf
Ressources nécessaires pour le TP :
- Etiqueteur d'Eric Brill en anglais : brill.zip (616Ko)
- Liste des étiquettes : étiquettes en anglais et en français
TP2 : Extraction de la terminologie (3h)
Enoncé du TP : pdf
Ressources nécessaires pour le TP :
- Corpus normalisé à partir duquel la terminologie devra être extraite : corpusNormalise.txt (28Ko)
TP3 : Perl
Enoncé du TP : pdf
Documentation Perl : http://www.med.univ-rennes1.fr/~poulique/cours/perl/
PROJET (2013)
Projet au choix (à faire en binômes) : Classification d'un corpus politique ou Classification de tweets