Projet Collex-Persée ‘RefDivinités’ : rapprocher IdRef et PACTOLS

Io accueillie à Canope par Isis, fresque du temple d’Isis à Pompéi, 62-79, Musée archéologique de Naples
Io accueillie à Canope par Isis, fresque du temple d’Isis à Pompéi, 62-79, Musée archéologique de Naples | © MANN, CC-PD-Mark via Wikimedia Commons

La rentrée a été l’occasion pour l’Abes, le réseau FRANTIQ (Fédération et Ressources sur l’Antiquité), la Maison Archéologie & Ethnologie René-Ginouvès (MAE) et sa bibliothèque d’archéologie et de sciences de l’Antiquité ainsi que la Bibliothèque Interuniversitaire de la Sorbonne (BIS) d’engager un dialogue autour du projet RefDivinités, lauréat de la 2nde vague de l’appel à projets CollEx-Persée.

Cette initiative vise à corriger, enrichir et aligner les entités du thésaurus PACTOLS (utilisé par les bibliothèques du réseau FRANTIQ) et les autorités d’IdRef concernant les divinités et héros du monde méditerranéen antique. L’amélioration de ces notices d’autorité devrait permettre d’indexer les collections de façon plus satisfaisante dans les différents catalogues, de mieux les intégrer au web de données, et de permettre leur réutilisation via Wikidata.

Continuer la lecture

Ouverture d’un nouveau service : le Triple Store data.idref.fr

Nouveau service proposé par l’Abes, le Triple Store data.idref.fr a pour objectif d’accroître les possibilités d’exploration et d’exploitation des données pour une réutilisation optimisée. 

Conformément aux principes d’ouverture du web sémantique qui guident les réalisations de l’Abes depuis 2010, les données d’autorité IdRef étaient déjà  modélisées en RDF, garantie de leur interopérabilité et d’une bonne exposition sur le Web.  Cependant, pour bénéficier pleinement de la richesse de cette modélisation, il est apparu nécessaire de mettre en service un Triple Store, base conçue spécifiquement pour les triplets RDF interrogeables dans le langage dédié Sparql.

Ainsi, dès son ouverture, data.idref.fr est riche d’environ 110 millions de triplets RDF – ce qui correspond aux 3,5 millions de notices d’autorité IdRef associés aux millions de liens générés avec les 11 millions de références bibliographiques Sudoc.

Continuer la lecture

Quand ScanR et IdRef s’associent pour identifier les acteurs de la recherche et de l’innovation


ScanR,  moteur de la Recherche et de l’Innovation, outil désormais bien connu dans la sphère de l’ESR, propose à la réutilisation de nombreux jeux de données sous licence ouverte. Ces données, également accessibles via la plateforme OpenData du MESRI, sont synchronisées avec data.gouv.fr, plateforme des données publiques françaises mis à disposition par la mission Etalab.

Continuer la lecture

Projet FNE : appel d’offres


À l’heure du web de données, les référentiels constituent un enjeu stratégique de visibilité et d’appropriation des données d’autorités.

Le projet porté par l’Abes et le département Métadonnées de la BnF pour la construction commune d’un Fichier national d’entités (FNE)  s’inscrit dans cette dynamique et marque une étape d’envergure dans la synchronisation des données gérées par les agences et leurs réseaux.

Continuer la lecture

Chantier Autorités : fin d’une première chasse aux doublons


indexInitié début juillet pour une période de 3 mois, le chantier Autorités  « Détection des doublons lourds » a permis de traiter collectivement près de 1 400 paires de notices. Il s’agissait de statuer sur des notices « Autorité Personne Physique », qualifiées de candidats doublons « lourds » du fait qu’elles comportaient des mentions de noms, prénoms et dates biographiques identiques.

Continuer la lecture

Rencontre ORCID-ABES autour d’IdRef !


L’ABES a eu le plaisir d’accueillir une délégation de l’équipe d’ORCID, à Montpellier mercredi 26 août 2015 : Laure Haak directrice exécutive et Josh Brown directeur régional pour l’Europe. ORCID est une entreprise à but non lucratif de soutien à la recherche, engagée dans la création d’un registre international d’identifiants de chercheurs.

logo_orcidAu programme de cette rencontre : apprendre à mieux se connaître en établissant les positionnements respectifs de chacun ; puis explorer les axes de convergence ; enfin s’accorder sur des actions communes pour marquer le début d’une coopération.

logoABES-150-249Le matin, les présentations d’IdRef  d’un côté et d’ORCID  de l’autre, ont rempli leur objectif de compréhension mutuelle et ont permis de dresser le constat d’une complémentarité, plutôt que d’une redondance, des deux projets.

 

L’après-midi, une session à vocation technique a permis d’imaginer un scénario d’interopérabilité entre les deux bases IdRef / ORCID, et au-delà avec les bases bibliographiques de l’ABES (Sudoc, theses.fr & Calames) et avec les bases des utilisateurs d’IdRef (Persée, HAL, etc.).

Il s’en est dégagée la perspective d’une synergie capable à terme :

– d’offrir aux usagers d’ORCID la possibilité d’alimenter automatiquement leur compte avec des données riches et soignées émanant de nos bases ;

– de faire bénéficier nos bases de la notoriété grandissante d’ORCID dans la communauté des chercheurs français.

Enfin, il a été convenu de traduire prochainement cette émulation dans un Mémorandum Of Understanding destiné à informer largement de la coopération amorcée ce jour entre l’ABES et ORCID : coopération non limitée mais d’emblée ouverte aux acteurs nationaux qui manifestent de l’intérêt pour l’enjeu de l’identification des personnes dans le domaine de l’IST.

Continuer la lecture

Journée Correspondants Autorités : les présentations sont en ligne


Les présentations de  la  Journée des correspondants Autorités qui s’est tenue le 2 octobre dernier  sont en ligne sur la page dédiée sur le site web de l’ABES.

Cet événement inédit à l’échelle du réseau a rassemblé près de 150 personnes. La qualité des interventions et des orateurs a parachevé la réussite de la journée. L’ABES remercie chaleureusement les intervenants ainsi que tous les participants à cette journée.

Continuer la lecture

IdRef : un moteur de recherche plus performant


Unicode-BrailleDepuis quelques jours, le moteur de recherche et l’interface d’affichage des résultats d’IdRef ont développé leurs capacités en matière de multi-écriture (Unicode UTF8), ce qui permet à IdRef d’être en parfaite conformité avec le Sudoc.

En effet, le moteur de recherche accepte désormais les arguments de recherche en caractères non-latins, qu’il s’agisse de caractères arabes, cyrilliques ou d’idéogrammes (…), il est possible de saisir des arguments de recherche en écriture originale : شيال ; Толстой ;  ; … et d’obtenir des résultats pertinents en forme retenue ou en forme(s) rejetée(s).

A titre d’exemples : http://www.idref.fr/131594052 ou http://www.idref.fr/076303446

Les caractères du latin dit « étendu » sont eux aussi pris en charge par le moteur de recherche. Ainsi en va-t-il de « Szymańska » qui retourne maintenant des résultats. Ce jeu de caractères donne lieu à une petite astuce : afin d’obtenir tous les résultats susceptibles de correspondre à la recherche, il est recommandé de remplacer le caractère diacritique, ici « ń », par un « ? » (caractère de troncature pour remplacer un seul caractère). En effet, pour le latin étendu, il arrive souvent (lorsque les systèmes ne les géraient pas) que le diacritique n’ait pas été reporté.

Enfin, cela semble aller de soi mais ce ne fut pas si simple : l’interface d’affichage des résultats a été améliorée afin de permettre l’affichage de ces caractères et ainsi d’afficher les notices les plus pertinentes lors d’une telle recherche.

Continuer la lecture

Le projet Qualinca


Qualinca > LogoAvec Qualinca, l’ABES est engagée dans un projet de recherche d’envergure, par la durée, l’enjeu et les partenaires. Qualinca est un projet de recherche financé par l’Agence Nationale de la Recherche, sur la période 2012-2015 (36 mois).
La qualité des catalogues avant tout
Qualinca s’intéresse à la « qualité et [l’]interopérabilité de grands catalogues documentaires », comme le Sudoc ou le catalogue de l’Institut national de l’audiovisuel (INA), autre partenaire du projet. Selon le parti pris de Qualinca, la qualité des catalogues tient essentiellement à la qualité des liens : liens externes tels que les préconisent les principes du linked data,  mais d’abord liens internes, notamment entre notices bibliographiques et notices d’autorité. En ce sens, Qualinca est bien en cohérence avec les grandes orientations de l’ABES : ouverture des données, investissement dans les technologies du web sémantique, valorisation des référentiels autour d’IdRef. Par ailleurs, Qualinca prend la suite de SudocAD, projet de 12 mois en partie financé par le TGE ADONIS et mené de concert avec l’équipe GraphIK du LIRMM, leader de Qualinca.
Selon les termes mêmes du site web du projet, « les objectifs scientifiques du projet sont de :
1/développer un cadre logique pour qualifier la qualité d’une base de connaissances documentaires vis-à-vis de l’identification des entités individuelles et des liens entre entités individuelles.
2/proposer des principes/méthodes/outils pour passer d’un certain niveau de qualité à un meilleur niveau ».
 Les partenaires
Les partenaires scientifiques du projet sont le Laboratoire d’informatique, de robotique et de microélectronique de Montpellier (LIRMM), le Laboratoire d’informatique de Grenoble (LIG) et le Laboratoire de recherche en informatique d’Orsay (LRI) . Ce sont tous des experts en bases de données, représentation des connaissances et web sémantique.
Le rôle de l’ABES
Qualinca est bien un projet de recherche, mais la contribution de l’ABES ne se limitera pas à l’apport de données et d’une expertise métier : l’approche théorique sera testée à travers le développement de démonstrateurs (détection de liens erronés ; automatisation du liage aux autorités, voire de la création d’autorités). Ces démonstrateurs seront eux-mêmes évalués en comparant décisions automatiques et décisions humaines. Le moment venu, nous solliciterons la participation des catalogueurs du réseau Sudoc à ce protocole d’évaluation.
Plus d’information sur le site web de Qualinca.

Continuer la lecture