Istex ne se résume pas à une base de publications numériques. Cette bibliothèque numérique scientifique est portée par toute une infrastructure informatique qui s’est déployée, dans un esprit open source, autour des besoins d’accès aux ressources et de mise à disposition d’outils d’exploitation de l’archive à différentes fins.
Les rubriques ci-dessous vous offrent l’opportunité d’aller plus loin dans l’utilisation de toutes les fonctionnalités d’Istex et de ses services associés.
API Istex
La base ISTEX est accessible directement via son interface de programmation applicative (API) de type REST utilisant le protocole HTTP. Vous préférerez peut-être l’interroger directement par ce biais, en vous connectant à l’adresse https://api.istex.fr/.
Pour comprendre comment elle fonctionne et savoir l’utiliser, retrouvez tous les détails techniques la concernant dans sa documentation.
Moissonneurs
Télécharger un corpus de documents avec l’application Istex-DL, c’est bien. Mais pour extraire de très gros volumes, sans limitation de taille, il est nécessaire d’utiliser un moissonneur.
Avec Istex, vous avez la chance d’avoir deux moissonneurs à disposition : le moissonneur istex-api-harvester et le moissonneur harvestCorpus. Développés respectivement en Node.js et en Perl, ils offrent chacun des possibilités différentes.
harvestCorpus présente en outre la particularité d’être associé à un autre outil, nommé statsCorpus, programme Perl de réalisation de statistiques sur les métadonnées du corpus que l’on vient d’extraire. Le fichier de résultats peut par la suite être enrichi ou exploité dans l’outil Lodex ou un outil de TDM.
Pour savoir installer ces deux moissonneurs, les utiliser en les paramétrant au moyen des options disponibles, reportez-vous à leurs documentations respectives. Pour les plus expérimentés, connectez-vous directement aux dépôts GitHub de ces outils.
istex-api-harvester
harvestCorpus
GitHub
La plateforme Istex, et ses outils associés, utilise à différentes étapes, pour différents besoins, des modules ou des services développés en open source et déposés sur le service d’hébergement GitHub.
Le nombre de dépôts apparentés à Istex dépasse la cinquantaine.
De même, Lodex est un outil open source, dont les développements sont disponibles sur une page GitHub dédiée, ce qui vous permet de l’installer sur votre propre machine.
Tous ces codes sources sont réutilisables librement.
Retrouvez-les aux adresses suivantes :