Page périmée. Consulter désormais les sujets de PPL 2003.

Sujets de PPL 2002

Le PPL est le Projet Personnel en Laboratoire des élèves de 2ème année de l'ENSTA, d'une durée de 2 à 4 mois,  débutant en mai.
 
 
Domaine scientifique Sujet Labo. & Lieu
Traitement de la parole et du langage Extraction de la fréquence fondamentale d'un signal de parole CTA Arcueil
Apprentissage automatique de grammaire probabiliste CTA Arcueil
Traduction automatique par méthodes statistiques CTA Arcueil
Traitement d'image - Vision Reconnaissance d'images par méthodes statistiques CTA Arcueil
Compression de dynamique d'image ENSTA Paris
Attributs multifractals pour la classification de textures dans des images CTA Arcueil
Reconstruction 3D à partir d'images aériennes ENSTA Paris
voir aussi les sujets de mes collègues J. Louchet et A. Manzanera ENSTA Paris
Robotique/informatique Appariement de cartes 2-D pour la navigation d'un robot mobile en milieu intérieur CTA Arcueil
Sujet LRP 2 LRP Vélizy
Sujet LRP3 LRP Vélizy
Génie logiciel - RdF Extraction d'images logées dans des documents numériques ENSTA Paris
OS Linux & Traitement d'image Développement d'une plate-forme de vision à base de WebCam sous Linux ENSTA Paris
OS Linux & Windows Sujet LRP 1 LRP Vélizy
Electronique numérique - Réseaux Webcam ethernet grande résolution intelligente ENSTA Paris
voir aussi les sujets de mon collègue O. Hammami ENSTA Paris


Extraction de la fréquence fondamentale d'un signal de parole

L'intonation est une information importante pour le traitement de la parole, par exemple pour distinguer « 703-1082 » de « 700-3082 », ou bien « pardon !~» en tant qu'excuse de « pardon ? » en tant que demande de répétition dans un système de dialogue.  Elle est encore peu utilisée dans la pratique, car déterminer la fréquence fondamentale d'un signal de parole (i.e. la hauteur de la voix) est un problème difficile et les algorithmes classiques manquent de robustesse. Cependant, de nouvelles approches permettent une robustesse accrue et fonctionnent sur une plage étendue de valeurs.

Le stage consiste principalement à optimiser un algorithme d'extraction de la fréquence fondamentale développé au laboratoire, tant en rapidité qu'en précision. Les performances seront mesurées objectivement sur des bases de données de référence.  On mettra en forme le code pour une diffusion sous licence libre.  Par ailleurs, des extensions de l'algorithme pourront être étudiées au niveau théorique.

Le stage a lieu au Centre Technique d'Arcueil de la DGA, au sein de l'équipe de traitement de la parole et du langage. La programmation se fera en C/C++ sous Unix.

Edouard GEOFFROIS
DGA - CTA/GIP
16 bis av. Prieur de la Côte d'Or
94114 Arcueil cedex
Tel: 01 42 31 96 68
Fax: 01 42 31 99 64
Email: Edouard.Geoffrois@NO-SPAM.etca.fr


Apprentissage automatique de grammaire probabiliste

\La modélisation du langage est un élément important de nombreuses
applications : reconnaissance de la parole, compréhension, traduction,
résumé automatique, etc.  Les modèles classiques sont soit à règles,
construits manuellement, soit de type probabiliste, appris sur des
grands corpus. Ces derniers sont plus robustes mais généralement
moins structurés. La tendance actuelle est d'associer les deux
approches et d'apprendre automatiquement des modèles structurés.

Le stage consiste à explorer les possibilités offertes par des modèles markoviens hiérarchiques pour modéliser le langage. Il s'agira de mettre en oeuvre des algorithmes permettant de construire les modèles (phase d'apprentissage) et de les utiliser pour analyser une phrase (phase de reconnaissance).  On vérifiera subjectivement que les modèles appris automatiquement correspondent bien à des catégories (syntaxiques, sémantiques) connues.  Les performances seront évaluées objectivement en mesurant la capacité de prédiction des modèles sur des données de test et leur apport en reconnaissance de la parole.

Le stage a lieu au Centre Technique d'Arcueil de la DGA, au sein de l'équipe de traitement de la parole et du langage. La programmation se fera en C/C++ sous Unix.

Edouard GEOFFROIS
DGA - CTA/GIP
16 bis av. Prieur de la Côte d'Or
94114 Arcueil cedex
Tel: 01 42 31 96 68
Fax: 01 42 31 99 64
Email: Edouard.Geoffrois@NO-SPAM.etca.fr


Traduction automatique par méthodes statistiques

Les systèmes de traduction automatique traditionnels sont basés sur des règles établies manuellement. L'approche statistique qui consiste à entrainer les systèmes à partir de corpus de textes bilingues reçoivent une attention croissante depuis quelques années. Ils offrent déjà une qualité de traduction similaire, et se prêtent bien à de nouvelles améliorations. Ils sont aussi capables d'associer une mesure de fiabilité à la traduction, et permettent de développer des systèmes dans de nouvelles langues avec beaucoup moins d'efforts manuels.

Il s'agit de développer et évaluer un système de traduction automatique simple, entraîné sur des textes bilingues. Ces corpus de textes alignés seront eux-mêmes construits automatiquement à partir de pages web. On partira d'outils existants, et on proposera des améliorations qui pourront être implémentées selon le temps disponible.

Le stage a lieu au Centre Technique d'Arcueil de la DGA, au sein de l'équipe de traitement de la parole et du langage. La programmation se fera en C/C++ sous Unix.

Sylvain SOLIMAN
DGA - CTA/GIP
16 bis av. Prieur de la Côte d'Or
94114 Arcueil cedex
Tel: 01 42 31 99 29
Fax: 01 42 31 99 64
Email: Sylvain.Soliman@NO-SPAM.etca.fr


Reconnaissance d'images par méthodes statistiques

Un système de reconnaissance d'images, reposant sur une modélisation statistique (modèles de Markov cachés) et sur un algorithme de reconnaissance original, est en cours de développement au sein du laboratoire.  Il est appliqué à une tâche de segmentation en facettes d'images d'objets polyédriques, tâche pour laquelle il existe une base de donnée permettant d'effectuer des évaluations comparatives. L'objectif est d'obtenir des performances supérieures au meilleur système existant actuellement pour cette tâche.  Les algorithmes sont néanmoins suffisamment généraux pour être appliqués à d'autres tâches.

Il s'agit d'apporter plusieurs améliorations au système, qui seront évaluées grâce à la base de donnée : gestion explicite des facettes, modélisation plus fine de l'orientation des facettes (par utilisation de combinaisons de gaussiennes au lieu de distributions gaussiennes simples), optimisation du prétraitement, amélioration des méthodes d'apprentissage. Concernant ces méthodes d'apprentissage, le sujet peut comporter une part importante de développements théoriques.

Le stage a lieu au Centre Technique d'Arcueil de la DGA. La programmation se fera en C/C++ sous Unix.

Edouard GEOFFROIS
DGA - CTA/GIP
16 bis av. Prieur de la Côte d'Or
94114 Arcueil cedex
Tel: 01 42 31 96 68
Fax: 01 42 31 99 64
Email: Edouard.Geoffrois@NO-SPAM.etca.fr


Sujet : Appariement de cartes 2-D pour la navigation d'un robot mobile en milieu intérieur

Ce travail a pour but l'etude et l'experimentation de methodes d'appariement de cartes construites par un petit robot mobile equipe d'un telemetre laser a balayage 2-D.

L'appariement de cartes locales est une des etapes entrant dans le processus de construction de cartes d'environnement et de localisation relative d'un robot. Cette etape permet ensuite d'assembler des cartes locales, d'enrichir les details de la carte globale et d'estimer les mouvements du robot. Les experimentations seront menees en milieu interieur avec des donnees en ligne ou hors ligne fournies par un telemetre laser IBEO monte sur un robot de type Pioneer 2AT.

Ce stage se deroulera dans les locaux du Centre Technique d'Arcueil (CTA) de la Delegation Generale pour l'Armement (DGA) situe a 1 km au sud de la porte d'Orleans (web : www.etca.fr).

Connaissances necessaires : programmation en C.

La nationalite francaise est requise.

Contact : Delphine Dufourd, tel : 01 42 31 97 07,
mail : ddufourd@etca.fr


Titre: Attributs multifractals pour la classification de textures dans des images

Description du stage:
Dans le cadre de la vision par ordinateur pour des applications militaires (navigation autonome, imagerie aérienne), il est important de pouvoir distinguer des zones homogènes (selon des critères très variables) dans des images. Ces zones peuvent être caractérisées de manière efficace par des attributs multifractals pour lesquels des estimateurs ont été programmés.

Afin d'accroître la rapidité et les performances sur des applications concrètes, on veut porter les programmes dans un environnement de développement de traitement d'images (GAMMAG) d'une part, et étendre le modèle déterministe à  un modèle probabiliste d'autre part.

Connaissances demandées: langage C, Unix (Linux), notions de base en traitement du signal et des images, statistiques et probabilités.

Lieu: Centre Technique d'Arcueil (CTA), Département Géographie-Imagerie-Perception (GIP).

Durée : 2 mois.

Contact: Lui Kam (01 42 31 96 45), Lui.Kam@etca.fr


Auteur de la page : T. Bernard
Dernière mise à jour : 4 mars 2002