Bonjour,
Une nouvelle fonctionnalité vient de faire son apparition sur l’API : l’extraction (ou export) de sous-corpus. Celle-ci est disponible sur la version d’intégration (api-integ.istex.fr).
Grâce à cette fonctionnalité, vous serez en capacité de demander à l’API de vous fournir une archive ZIP contenant les fichiers relatifs aux documents correspondants à votre recherche.
Pour ceux et celles d’entre vous qui profitent d’une connexion internet très rapide, vous remarquerez peut-être que cette extraction est moins performante que lorsque vous utilisez le harvester. La raison est simple : l’extraction via l’API compresse à la volée l’ensemble des données envoyées, alors que le harvester se contente de renvoyer les fichiers sans l’étape de compression.
Pour résumer, la fonction d’export présente les avantages suivant :

  • plus rapide que le moissonnage document par document lorsque votre connexion Internet n’est pas très rapide (connexion ADSL, par exemple)
  • pas besoin de scripter ou d’automatiser le moissonnage, il suffit de saisir l’URL dans le naviageur

Voici un exemple d’extraction, le plus simple qui soit : api-integ.istex.fr/document?q=brain&extract
Vous trouverez également la documentation correspondante ici.
Comme d’habitude, n’hésitez pas à nous faire part de vos remarques dans les commentaires.

besoin d'aideBesoin d'aide ?

Besoin d'aide ?

Consultez notre Faq, la documentation Istex ou nos tutoriels

N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !

Écrivez-nous

fermer la modale