Poisson rejoignant ses congénaires en sautant d'un bocal à un autre.

Nous vous avons récemment informé de l’ajout dans Istex du nouveau bouquet « oa-plos », le premier d’une future série contenant des publications exclusivement en Libre Accès (Open Access).

Après une première étape expérimentale intégrant un faible nombre de documents, nous achevons aujourd’hui l’intégration de l’ensemble des données de l’éditeur PLOS dont nous disposons, soit un total de 237 747 articles scientifiques.

Pour rappel, ces données nous ont été fournies gracieusement par Patrice Lopez (Société Science-Miner). Elles ont été identifiées et moissonnées à partir de la base Unpaywall, puis converties dans un format TEI et enrichies à l’aide des outils de « l’écosystème Grobid » (appellation non-officielle regroupant de nombreux outils disponibles sur le compte github de P. Lopez).

Les publications du bouquet PLOS d’Istex couvrent une période allant de 2003 à 2023 et sont issues des 13 revues suivantes :

  • PLOS ONE
  • PLOS Neglected Tropical Diseases
  • PLOS Pathogens
  • PLOS Genetics
  • PLOS Computational Biology
  • PLOS Biology
  • PLOS Medicine
  • PLOS Global Public Health
  • PLOS Digital Health
  • PLOS Climate
  • PLOS Water
  • PLOS Sustainability and Transformation
  • PLOS Clinical Trials
D’un point de vue technique, ce corpus est traité comme la plupart des bouquets issus des négociations avec les éditeurs. Chaque document est disponible :
  • dans un format XML source (TEI dans notre cas)
  • dans sa version PDF originale
  • dans une version XML-Mods
  • et dans l’ensemble des formats générés par notre chaîne de traitement, ce qui inclut les enrichissements « teeft » et « nb » (extraction de mots-clés et catégorisation automatique).

Il va de soi que les documents PLOS peuvent être utilisés à des fins de TDM (Text & Data Mining).

Les documents de ce bouquet étant disponibles en Libre Accès, ils bénéficient de la nouvelle fonctionnalité de notre application web Istex Search, qui permet de rebondir en un clic sur la plateforme de l’éditeur.
Capture d'écran de l'application Istex-Search montrant le bouton en forme de cadenas orange permettant d'accéder à un document sur sa plateforme d'origine.

Bouton d’accès au document sur sa plateforme d’origine

On notera que l’ajout de ce nouveau bouquet nous permet de dépasser les 28 millions de documents disponibles dans Istex (nombre total précis : 28 178 103).
Ce nombre augmentera encore prochainement avec l’ajout de nouveaux bouquets issus d’acquisitions ainsi que d’autres bouquets en Libre Accès, qui sont d’ores et déjà prévus.

Nous vous souhaitons une bonne consultation.

Claude, pour l’équipe Istex

besoin d'aideBesoin d'aide ?

Besoin d'aide ?

Consultez notre Faq, la documentation Istex ou nos tutoriels

N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !

Écrivez-nous

fermer la modale