lundi, novembre 13, 2006

un moteur de recherche spécialisé en sciences sociales

In-Extenso : Un moteur de recherche pour les sciences sociales !


Revues.org annonce l’ouverture d’In-extenso, le premier moteur de recherche des sciences humaines et sociales. Ce moteur de recherche spécialisé explore une partie sélectionnée de la « Toile mondiale » : les pages consacrées aux sciences humaines et sociales.
Alors que le corpus des documents en ligne en sciences humaines et sociales a pris consistance, l’enjeu est désormais de le repérer, de l’indexer et d’élargir sa visibilité. Consciente de cette nécessité, l’équipe de Revues.org a mené pendant quatre années une expérience d’indexation. Cette démarche dépasse aujourd’hui le stade expérimental. Elle a pour nom In-extenso et prend la forme originale d’un moteur de recherche à deux étages. L’étage « OAI » (pour Open archives initiative) donne accès à une vingtaine de dépôts de documents scientifiques (au rang desquels on compte Gallica, Hal-SHS, Cyberthèses, Persée, Revues.org...), soit 135 000 documents environ. L’étage « web » indexe le contenu de 2 000 sites web dédiés aux sciences humaines et sociales (Universités, laboratoires, sites thématiques, expositions, publications diverses...), ce qui constitue un corpus d’une taille inédite : plus de quatre millions de pages web. Minuscule, au regard de la taille des grands moteurs généralistes (plus de huit milliards de pages en général), gigantesque, au regard de l’ambition d’un moteur dont le corpus doit être contrôlé, ce nombre est atteint grâce à l’alliance d’In-extenso avec L’Album des sciences sociales. L’étage « web » indexe le contenu des 2 000 sites sélectionnés par L’Album des sciences sociales, le répertoire critique de ressources électroniques en sciences humaines et sociales, réalisé dans le cadre de Revues.org par une équipe de chercheurs et de documentalistes.

In-extenso est la première initiative de ce type à dépasser le stade expérimental. Pour un historique, on peut lire les billets écrits à ce sujet dans Blogo-numericus (1) (2). Il faut espérer que le projet sera imité, afin de constituer des moteurs de recherche spécialisés, plus précis, plus pratiques, plus ouverts, plus efficaces. En ce domaine, le monopole d’un acteur, fût-il aussi connu que Google ou que son dérivé académique (le décevant Google scholar), n’est pas souhaitable.

Marin Dacos

Aucun commentaire: