GramLab lance Corpus Manager 1.2
GramLab lance sa solution open source de conversion et d'assemblage de documents hétérogènes baptisée GramLab Corpus Manager.
Téléchargeable gratuitement, cette version 1.2 de Corpus Manager permet donc de collecter et de convertir un ensemble de documents de formats différents en un seul et même format (XML TEILite) pour créer des collections (par thèmes) et les assembler au sein d'un seul et même fichier. "GramLab Corpus Manager répond à la nécessité première qui se pose lors du traitement et de l'analyse linguistique d'un large ensemble documentaire hétérogène" précise Kwaga, éditeur et membre du consortium GramLab. Il s'agit là d'un premier pas vers la mise à disposition de solutions open source de traitement linguistique des données non structurées de l'open data et du Big Data.
D'autres outils accompagneront Corpus Manager dont GramLab IDE (un environnement dédié à la création et à la maintenance de grammaires et de ressources linguistiques pour l’analyse automatique), GramLab linguistic Resources (des ressources linguistiques d’exemple tels corpus, grammaires et dictionnaires) ou encore GramLab Annotators (un annotateur UIMA générique permettant d’intégrer les fonctions d’analyse linguistique dans une chaîne de traitement documentaire).





