Rapport d'activité « 1er semestre »
1. Identification
Partenaire | Mostrare |
---|---|
Rédacteur | Fabien Torre |
Téléphone | 03 20 41 72 98 |
Date | lundi 28 août 2006 |
2. Rappel des tâches partenaire
Les livrables de Mostrare sont attendus dans le lot 2 « Extraction de contenu » :
- à 18 mois : intégration dans la plate-forme d'un système d'induction interactif de wrappers pour les documents semi-structurés ;
- à 24 mois : rapport bilan de la phase d'expérimentation des prototypes sur les domaines d'applications recensés (avec INRA et LIP6) ;
- à 30 mois : version finale du système d'induction de wrappers.
3. Description des travaux du partenaire
Nous avons assisté à la réunion kick-off du projet le 24 avril 2006 (Marc Tommasi pour représenter Mostrare).
Dans le lot 2 « Extraction de contenu »
Nous avons participé à la réunion de lancement du lot 2 le 11 juillet 2006 (Fabien Torre pour représenter Mostrare).
Nous avons pu au cours de cette réunion mettre en avant notre expertise dans la prise en compte de la structure des documents, mais par là-même notre manque d'expérience dans la gestion du texte proprement dit.
Nous avons recueilli en retour les offres d'interactions avec les outils textuels de deux partenaires : LIP 6 et CEA. Il est en particulier envisagé d'intégrer les sorties de l'analyseur du CEA à notre représentation des documents.
Enfin, nous avons convenu de mettre en place un groupe de travail sur le thème « Extraction et Apprentissage », impliquant Mostrare ainsi que les partenaires LIP 6 et Thalès.
Par ailleurs, nous travaillons en collaboration avec le partenaire INRIA-Gemo sur le cas plus spécifique des services web, à savoir l'extraction d'information à partir de pages résultant d'une requête posée par l'intermédiaire d'un formulaire HTML.
Dans le lot 3 « Enrichissement sémantique »
Mostrare était également présent aux réunions du lot 3 : réunion de lancement le 31 mai 2006 (Marc Tommasi et Florent Jousse pour représenter Mostrare) et réunion du sous-lot 3.3 le 5 juillet 2006 (Rémi Gilleron pour représenter Mostrare).
8. Aspects non scientifiques
Un recrutement est en cours avec pour profil « Ingénieur R&D - Transformations de données structurées et semi-structurées (XML, HTML) ».