Skip to main content

Parlement grec : rendre les anciennes données parlementaires utilisables grâce au crowdsourcing

Bulletin de l'innovation | Troisième édition | 30 sept 2019
Making past parliamentary data usable through crowdsourcing

Rendre les anciennes données parlementaires utilisables grâce au crowdsourcing

Bulletin de l'innovation de l'UIP, Troisième édition, 30 septembre 2019

Quel problème la plateforme de reconnaissance optique des caractères tente-elle de résoudre ?

Le Parlement grec conserve les questions parlementaires sous la forme d'une combinaison de métadonnées extraites manuellement du texte original et du document scanné en format image. Les questions parlementaires ne sont donc pas largement accessibles ni étudiées en raison des difficultés d'accès au contenu original. Un processus de reconnaissance optique des caractères en 10 étapes a été conçu pour reconstituer le contenu original intégral des questions parlementaires. Les résultats de ce processus sont associés aux métadonnées pour reproduire le texte intégral du document original.

Pourquoi avoir opté pour le crowdsourcing ?

Combler les lacunes des données par étapes s'est révélé très long et fastidieux, ce qui nous a poussés à tenter le crowdsourcing pour accélérer le travail. Une équipe de scientifiques spécialisés dans un large éventail de disciplines, notamment des universitaires, des représentants officiels et des étudiants de plusieurs institutions (par exemple le Parlement grec, l'Université d'Athènes et l'Université de Chypre), ainsi que des développeurs de logiciels contractuels ou indépendants, se consacre à ce projet.

Comment la plateforme de reconnaissance optique des données fonctionne-t-elle ?

Les 27 membres répartis dans 7 pays sont reliés sur un mode virtuel par une plateforme d'échange en ligne, tandis que les membres basés à Athènes se réunissent à l'occasion de rencontres mensuelles, au cours desquelles ils discutent des problèmes et échangent des bonnes pratiques. Lors de leur entrée dans le groupe, les nouveaux arrivants reçoivent une formation de base, les membres plus expérimentés, qualifiés de "mentors", donnant des conseils et offrant leur soutien entre pairs. Les membres de l'équipe se chargent des textes parlementaires qui leur ont été attribués, selon leurs possibilités et à leur rythme. Les mentors vérifient alors la qualité des unités de textes traitées, appelées "paquets", qui sont ensuite soumises à un examen scientifique.

Qu'en retirent les participants ?

Cette initiative est à l'avantage de tous, car elle permet aux participants d'accéder en amont aux projets scientifiques et d'acquérir de nouvelles compétences précieuses, ainsi qu'une expérience de travail concrète, en échange de leur temps et de leur engagement.

Quel est le bénéfice ultime de cette opération ?

Au terme de ce processus, le contenu numérique sera disponible dans un format ouvert et structuré, tel que XML (eXtensible Markup Language : langage de balisage extensible). Il deviendra alors possible de lui appliquer des méthodes et des outils innovants issus de la linguistique informatique. La mise à disposition d'un corpus unifié et vérifié permettra de relier des domaines de recherche jusqu'à présent déconnectés, tels que l'histoire, les sciences politiques et la linguistique, ce qui ouvrira de nouveaux horizons en matière de compréhension des informations et des débats parlementaires.

Quel avenir l'Équipe de reconnaissance optique des données a-t-elle devant elle ?

La plateforme, qui a presque terminé de saisir une dizaine d'années de données relatives au contrôle parlementaire, a réorienté ses activités et s'efforce désormais de guider le Parlement grec, entre autres, dans sa transition au numérique grâce à l'informatique juridique et aux données ouvertes liées. Par ailleurs, la plateforme crée des logiciels libres destinés à mener et structurer la collecte de données et à réaliser des analyses de linguistique informatique et l'Équipe grecque de reconnaissance optique des données a désormais l'intention de transformer ses activités en une série d'applications et de services ayant comme objectif ultime de servir de plateforme d'intégration et de migration susceptible d'être configurée et étendue en fonction des besoins de n'importe quel parlement ou organisation.  

Personne à contacter : 
M. Fotis Fitsilis, Service scientifique, Parlement grec
Courriel : [email protected]
Tél. : +30 210 3673395