Option : spécialités Mitic, Miage
Responsable
Eva Kijak
Objectifs
L'énorme accroissement de la quantité des documents multimédias numérisés disponibles pose le problème de la gestion et de l'accès à ces données : rien ne sert de stocker des données que l'on ne saura pas retrouver. À partir d'une présentation des besoins et des contextes applicatifs, tant pour les milieux professionnels (archives de télévision, agences de photos, grands corpus textuels) que pour les particuliers, le module abordera les techniques d’indexation existantes et les problèmes actuels pour les médias image et texte. Les systèmes de recherche d’information, ainsi que leur évaluation et les problèmes posés par la gestion effective des index au sein des bases de données seront présentés. La collaboration entre les médias conclura le module.
Plan détaillé
- Introduction : les documents multimédias, les utilisateurs et leurs besoins, les contextes applicatifs
- Description d'images fixes : descripteurs globaux, couleur, forme, texture
- Reconnaissance d'objets : descripteurs locaux et invariants
Indexation automatique de documents textuels : modèles booléen et vectoriel, méthodes statistiques de choix d'index - Traitement automatique des langues (TAL) et recherche d'information : utilisation d'éléments et d'outils standards du TAL et de l'apprentissage artificiel, méthodes linguistiques de choix d'index, traitement de la sémantique
- Système de recherche d’images par le contenu et évaluation. Aspects bases de données et couplage de médias.
Travaux pratiques et applicatifs
Les travaux pratiques permettront de mettre en œuvre et de tester des systèmes de recherche d’information basés image et texte, utilisant les descripteurs et les méthodes présentés en cours.
- Comparaison d’images : extraction de descripteurs globaux et comparaison de différentes mesures de similarité.
- Application à la recherche d’image et la classification.
- Extraction de descripteurs locaux et évaluation. Application à la recherche d’images et évaluation.
- Développement et évaluation d’un moteur de recherche textuel
Pré-requis
- Programmation Perl et C, C++ ou Java
- Notions de traitement d’image (facultatif)
Compétences développées
À l’issue de l’option, les étudiants maîtrisent les techniques d’indexation couramment utilisées pour les media image et texte. Ils ont également acquis une bonne connaissance du fonctionnement des systèmes de recherche d’information et des problématiques associées.
Horaire
12 h CM
4 h TD
16 h TP