L’équipe ISTEX-Corpus publie une première collection de corpus spécialisés sur data.istex.fr :
Collection Food S&T
Cette collection contient un corpus créé à partir de la thématique « Food Science and Technology » du Web of Science.
Parmi les thématiques retenues lors de la première réunion des partenaires du projet ISTEX en septembre 2014 (Diabète, Cancer du sein, Vieillissement, Astrophysique, Energie éolienne, Agro-alimentaire, Foresterie), la thématique de l’agro-alimentaire, comportant quelques documents en français dans le fonds ISTEX, a été choisie pour répondre à la demande de certains partenaires souhaitant travailler dans cette langue. Elle a ensuite été recentrée sur la thématique du WoS pour limiter le risque de ramener des documents trop disparates.
Corpus de la collection :
Corpus Food S&T :
Créé en 2015, il a été le premier corpus constitué avec des documents du fonds ISTEX.
Il compte 8 779 documents :
- 8 748 en anglais
- 115 en français, principalement issus de la revue Canadian Institute of Food Science and Technology Journal / Journal de l’institut Canadien de Science et Technologie Alimentaire.
Le Laboratoire d’Informatique de Nantes-Atlantique (LINA), partenaire du projet ISTEX, a utilisé ce corpus pour l’optimisation de l’outil TermSuite dans la détection de termes et de leurs variantes.
Ce corpus peut être téléchargé et réutilisé dans le cadre de vos recherches : vous trouverez tous les renseignements nécessaires sur sa page d’accueil.
Accès à la collection et au corpus :
https://food-collection.corpus.istex.fr/
Contact :
N’hésitez pas à nous faire part de vos questions, sur la liste de discussion users@listes.istex.fr, ou sur la messagerie des équipes ISTEX contact@listes.istex.fr.
Besoin d'aide ?
Consultez notre Faq, la documentation Istex ou nos tutoriels
N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !