Dans le cadre des nouveaux services proposés par l’infrastructure Istex, opérée par l’Inist-CNRS, voici la deuxième présentation d’un outil autonome et interopérable pour la fouille de textes ou TDM (Text and Data Mining).
Le 39e web service est à votre disposition. topRefExtract, le nouveau web service recensé sur ISTEX TDM, s’intéresse aux citations.
Son objectif ? Il identifie les N publications (10 par défaut) les plus citées dans un corpus donné.
La méthode ? Il prend en entrée une liste de DOI et interroge l’API OpenAlex à l’aide de cet identifiant pour récupérer la notice correspondante. Il extrait les publications citées par l’article puis regroupe ensuite toutes les références citées de chaque article du corpus. Il identifie alors celles qui ont le plus de citations.
Enfin, il renvoie :
– les N publications les plus citées, en précisant le nombre de citations pour chacune d’entre elles
– les DOI des articles qui les ont citées.
Son utilisation ? Comme pour une partie des autres web services :
– via Lodex, un outil open source de visualisation et de traitement de données structurées développé à l’Inist. Cette plateforme permet d’importer vos données, de les traiter selon vos besoins, avec nos web services, de visualiser les résultats de façon dynamique et enfin de les publier sous forme de site web.
– via IA Factory, interface de chargement de corpus et d’exécution d’outils TDM
– via une ligne de commandes (outils curl, wget, ou autres, pour des utilisateurs plus avancés)
Venez consulter le catalogue des web services ISTEX TDM pour trouver des outils d’aide à l’analyse de données et de textes.
Valérie Bonvallot pour l’équipe TDM
Besoin d'aide ?
Consultez notre Faq, la documentation Istex ou nos tutoriels
N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !