IdRef : un moteur de recherche plus performant

filabes

il y a 12 ans

Depuis quelques jours, le moteur de recherche et l’interface d’affichage des résultats d’IdRef ont développé leurs capacités en matière de multi-écriture (Unicode UTF8), ce qui permet à IdRef d’être en parfaite conformité avec le Sudoc.

En effet, le moteur de recherche accepte désormais les arguments de recherche en caractères non-latins, qu’il s’agisse de caractères arabes, cyrilliques ou d’idéogrammes (…), il est possible de saisir des arguments de recherche en écriture originale : شيال ; Толстой ; 莉 ; … et d’obtenir des résultats pertinents en forme retenue ou en forme(s) rejetée(s).

A titre d’exemples : http://www.idref.fr/131594052 ou http://www.idref.fr/076303446

Les caractères du latin dit « étendu » sont eux aussi pris en charge par le moteur de recherche. Ainsi en va-t-il de « Szymańska » qui retourne maintenant des résultats. Ce jeu de caractères donne lieu à une petite astuce : afin d’obtenir tous les résultats susceptibles de correspondre à la recherche, il est recommandé de remplacer le caractère diacritique, ici « ń », par un « ? » (caractère de troncature pour remplacer un seul caractère). En effet, pour le latin étendu, il arrive souvent (lorsque les systèmes ne les géraient pas) que le diacritique n’ait pas été reporté.

Enfin, cela semble aller de soi mais ce ne fut pas si simple : l’interface d’affichage des résultats a été améliorée afin de permettre l’affichage de ces caractères et ainsi d’afficher les notices les plus pertinentes lors d’une telle recherche.