Document Image Analysis 
RFAI > Document Image Analysis
 
 

Analyse et indexation de documents anciens

Une collaboration avec le CESR de Tours nous donne l'opportunité de travailler sur la numérisation et l'indexation d'ouvrages anciens (datant de la Renaissance). Notre travail de recherche concerne l'extraction de la structure physique et logique et la trascription de ces documents à partir de la version numérisée (image) de chacune des pages afin de faciliter leur conversion au format XML.
Ces recherches s'inscrivent également dans le cadre du projet Madonne et de l'ANR Navidomass, labellisée et financée par le ministère de la recherche (2003 - 2006 puis 2006-2009) mettant en collaboration de nombreux laboratoires de recherche français.

L'ANR Digidoc (2011-2014) en cours concerne plus la mesure de la qualité de la numérisation des documents anciens.
  
La région Centre contribue également aux recherche dans ce domaine via le financement du projet PIVOAN (2008-2009).

Une vidéo a d'ailleurs été réalisée par la région présentant ce projet. Voir la vidéo

L'équipe bénéficie également du soutien de Google (google digital humanities award 2010) pour faire avancer ses recherches dans cette thématique.

 Google Award Project shared space


                                     


Ces travaux nous ont permis de produire un prototype logiciel nommé AGORA utilisé actuellement par le CESR de Tours pour la mise en ligne de sa Bibliotheque Virtuelle Humaniste. Une version d'évaluation du prototype logiciel AGORA est téléchargeable ici.

Espace collaboratif Vidéo AGORA. Streaming .

 


Symbol recognition and spotting

People : J.Y. Ramel, R.J. Qureshi, M.M. Luqman, M. Delalandre

Description : L'objectif de l'interprétation automatique de documents graphiques est de faciliter l'exploitation des dessins ou schémas en proposant un ensemble d'étapes permettant la transformation du schéma papier en un stockage numérique interprété. Il s'agit alors d'extraire l'information graphique et alphanumérique du document pour reconstituer la sémantique associée aux differents objets du dessin et leurs relations.

Actuellement, dans notre équipe, les travaux en cours dans cette thématique concernent :

  1. Les methodes de transformation d'images de documents en une représentation structurelle efficace.
  2. la mise en place de nouvelles methodes de localisation de symboles ou spotting.
  3. la mise en place de nouvelles methodes de reconnaissances structurelles de symboles.
  4. Performance characterization methods aims to match symbol recognition and spotting results to groundtruthed datasets.

Funding :

2005-2007 : EPEIRES project (Funded by the Techno vision program 2005-2006)

2005-2008 : PhD Grant of R.J. Qureshi, program of PhD Scholarships for Natural and Basic Sciences France, Higher Education Comission - Pakistan, Grant N° xxxx

2008-2011 : PhD Grant of M. Luqman, program of Overseas Scholarship For PhD in Selected Field (Phase-II), Higher Education Comission - Pakistan, Grant N°  PD-2007-1/Overseas/FR/HEC/222 

Partners : DAG Group (CVC, Barcelona city, Spain), QGAR Team (LORIA, Nancy city, France)

Related projects : SymbolRec

 

Une version d'évaluation du prototype produit (VectoGraph) est téléchargeableici.

Espace collaboratif Vidéo Streaming Vectograph.

 


OCR evaluation protocol

People : K. Ait-Mohand, T.Paquet, N. Ragot, L. Heutte

Description : Beside the Navidomass ANR project in which we are working on OCR problems for old documents, the group is also working with the LITIS lab from Rouen and with the Bibliothèque Nationale de France (BnF) on the elaboration of an OCR evaluation protocol. These works are conducted thanks to the PhD of K. Ait-Mohand who is an associate researcher at the BnF in reply to the BnF call for associate researcher on new technologies n°48 in 2008-2009 (Analyse des résultats de conversion par océrisation des documents imprimés numérisés de la Bibliothèque nationale de France). This project was prolongated for the year 2010.

Partners : LITIS team "Documents et Apprentissage" (Rouen, France), BnF

Related projects : ANR Navidomass

 

 

 

 
Laboratoire d'Informatique
Equipe Reconnaissance des formes et analyse d'images
64, avenue Jean Portalis
37200     Tours

téléphone : 02 47 36 14 14
télécopie : 02 47 36 14 22