Mathieu Roche
CIRAD Research Scientist (PhD, HDR) in Computer Science
Content [Teaching]
Contact
-
UMR TETIS
AgroParisTech, Cirad, Cnrs, INRAe
500, rue J.F. Breton
34093 Montpellier Cedex 5, France
Extraction de Connaissances Avancée (ECA) - M2 Master DECOL
TEACHING
Data Mining and agriculture (2015) - Mathieu Roche
- Data mining applied to environmental and agriculture domains
Sciences des Données envionnentales (2016) - Mathieu Roche
Cours : Fouille de textes - Applications aux données environnementales
TP :
- Enoncé de TP : Etiquetage et Terminologie
- Une chaîne globale de fouille de textes : Etiquetage grammatical
- Une chaîne globale de fouille de textes : Evaluation de la Terminologie
STAGES 2016-2017
- Stage Recherche (projets QDoSSI et SONGES) : Détermination des itinéraires migratoires contextualisés à partir de récits de vies
- Stage Recherche (projet SONGES) : Titrage automatique des thématiques identifiées dans les corpus
- Stage Professionnel (projet PNS) : Intégration et visualisation de données issues du projet Patrimoine NumériqueScientifique du Cirad
- Stage Professionnel : Extension d?un logiciel de veille sanitaire pour analyser l?émergence et la propagation de maladies animales
Extraction des Connaissances à partir des Données (ECD) - M1 Master DECOL
COURS
Cours de Fouille de Textes et analyse de sentiments (02 octobre 2014) - Mathieu Roche
- Partie 1 : Généralité en RI et EI
- Partie 2 : Généralité en FdT
- Partie 3 : Analyse de sentiments et fdT
Extraction des Connaissances à partir des Données (ECD) - M1 Master DECOL
COURSCours de Fouille de Textes - Mathieu Roche
- Généralité Fouille de Données
- Processus Global de Fouille de Textes
- Processus FdT : Etiquetage grammatical
- Processus FdT : Extraction de la terminolgie (approche non supervisée)
- Classification conceptuelle
- Généralité en Recherche d'Information (RI)
- LSA
Cours de Fouille de Données - Eric Kergosien
- Fondements
Cours de Fouille de Données - Maguelonne Teisseire
- Extraction de motifs : Règles d'association et motifs séquentiels
Cours de Fouille de Données, Ontologies et Web Semantique - Konstantin Todorov
- Data Mining, Ontologies and the Semantic Web
Cours de Recherche d'Information (supplément) - Mathieu Roche
- Chaînes des caractères et RI
Cours de Fouille de Données - Anne Laurent
- Généralités sur la Fouille de Données
Cours de classification - Dino Ienco
- Data Mining - Classification: Basic Concepts
- Feature Selection
- Pre-processing techniques for text classification
- Weka
Cours et TP de clustering - Eniko Székely
- Cours "Clustering: methods and evaluation"
- TP "Clustering"
Extraction de motifs - Maguelonne Teisseire et Pascal Poncelet
- Extraction de motifs : Règles d'association et motifs séquentiels (M. Teisseire)
- Règles d'Association et Motifs Séquentiels (P. Poncelet)
Fouille de Données et Santé - Sandra Bringay
- Fouille de Données et Santé
TP
TP1 : Etiqueteur de Brill
Enoncé du TP : pdf
Ressources nécessaires pour le TP :
- Etiqueteur d'Eric Brill en anglais : brill.zip (616Ko)
- Liste des étiquettes : étiquettes en anglais et en français
TP2 : Extraction de la terminologie
Enoncé du TP : pdf
Ressources nécessaires pour le TP :
- Corpus normalisé à partir duquel la terminologie devra être extraite : corpusNormalise.txt (28Ko)
TP3 : Fouille de Données avec Weka
Présentation de Hugo Alatrista Salas : pdf
PROJET (2013)
Projet (à faire en binômes) : Classification de texes
Les soutenances du projet sont prévues le 31 mai 2013 et la remise des rapports le 28 mai 20013 (voir planning)
Le planning des soutenances est diponible : pdf
Extraction des Connaissances Avancée (ECA) - M2 Master DECOL
COURS
- Extraction de motifs : Règles d'association et motifs séquentiels - Maguelonne Teisseire : pdf
- Ensemble Learning - Dino Ienco : pdf
- Visualisation d'Information - Arnaud Sallaberry : lien
- Fouille de Données et Santé - Sandra Bringay : pdf
- Approches pour l'extraction de connaissances à partir de textes et de ressources structurées - Eric Kergosien : pdf
EXAMEN (2013)
- Articles pour l'examen : zip
Sémantique et Fouille de Textes - M2 Master DECOL
EXAMEN (2013)
Le but de l'examen est de lire et analyser les articles donnés par chacun des enseignants (articles tout à fait accessibles pour les étudiants des filières "pro" et "recherche"). Le jour de l'examen programmé le 11 janvier 2013 (cf. calendrier), vous devrez choisir 3 articles (sur les 4) et répondre aux questions relatives à ces documents.
La deuxième session programmée le 06 mars 2013 (cf. calendrier) s'appuiera sur les mêmes articles.
- Article de Mathieu Roche :
QuickView: NLP-based Tweet Search. Xiaohua Liu, Furu Wei, Ming Zhou, QuickView Team Microsoft. Proceedings of ACL (demonstration session), 2012
- Article de Jean-Philippe Prost :
Structural disambiguation with constraint propagation. Hiroshi Maruyama. Proceedings of ACL, 1990
- Article de Violaine Prince :
Conflict resolution in collaborative planning dialogs. Jennifer Chu-Carrolland, Sandra Carberry. Int. J. Human-Computer Studies, Vol. 53, p.969-1015, 2000
- Article de Mathieu Lafourcade :
Ant Colony Algorithm for the Unsupervised Word Sense Disambiguation of Texts: Comparison and Evaluation, COLING'2012, the 24th International Conference on Computational Linguistics, 2012
Le TP d'extraction de la terminologie est à envoyer le 7 janvier 2013 au plus tard à l'adresse ci-dessous :
Planning général de l'ensemble des enseignemens de fouille de donnée / fouille de textes
Le planning indique quatre modules de la mention informatique qui traitent de fouille de textes :• FMIN311 - Extraction des Connaissances à partir des Données (ECD) : S2 (2ème semestre Master 1 DECOL)
• GMIN313 - Extraction de Connaissances Avancée (ECA) : S3 (1er semestre Master 2 DECOL)
• GMIN336 - Sémantique et Fouille de Textes : S3 (1er semestre Master 2 DECOL)
• FMIN361 - Fouille de Données : S3 (1er semestre Master 2 IPS)