Chers utilisatrices et utilisateurs,
Nous venons d’achever un nouveau rechargement de corpus, avec son lot de nouveautés. Parmi elles, nous vous présentons ici la mise en place des indicateurs de qualité.
En effet, nous avons inséré un module dans notre chaîne d’ingestion ajoutant un champ qualityIndicators pour chaque objet documentaire. Ce dernier est, dans cette première version, renseigné par 7 champs :
"qualityIndicators": { "score": 9.5, "pdfVersion": "1.6", "refBibsNative": false, "abstractCharCount": 1714, "pdfWordCount": 8441, "pdfCharCount": 37543, "abstractWordCount": 276 }
Nous retrouvons la version du PDF, la présence de références bibliographiques fournies par l’éditeur, le nombre de mots et de caractères présent dans le PDF et le nombre de mots et de caractères présent dans le résumé.
Les 6 champs précédemment cités nous permettent d’introduire le septième champ : le score. Ce dernier nous aide à améliorer les résultats des recherches sur l’API : plus le score est important, plus ce dernier sera en tête des résultats. Pour savoir comment ce score est calculé, nous vous invitons à consulter la documentation de l’API ici. Le score évoluera par la suite avec l’apparition de nouveaux champs.
D’ailleurs, qui dit nouveaux champs dit intégration de nouvelles facettes. En effet, il est maintenant possible d’interroger l’API avec les facettes de même nom que le champ demandé :
score abstractCharCount abstractWordCount pdfWordCount pdfCharCount
de type range (comme copyrightDate), et
refBibsNative pdfVersion
de type terms (comme corpusName)
Ces facettes ont également été implémentées au niveau du démonstrateur, consultable ici.
Pour toutes suggestions et/ou remarques, n’hésitez pas à nous laisser un commentaire !
Besoin d'aide ?
Consultez notre Faq, la documentation Istex ou nos tutoriels
N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !