IFLA

As of 22 April 2009 this website is 'frozen' in time — see the current IFLA websites

This old website and all of its content will stay on as archive – http://archive.ifla.org

IFLANET home - International Federation of Library Associations and InstitutionsAnnual ConferenceSearchContacts
*    
To Bangkok Conference programme

65th IFLA Council and General
Conference

Bangkok, Thailand,
August 20 - August 28, 1999


Code Number: 009-143-F
Division Number: VI
Professional Group: Information Technology
Joint Meeting with: -
Meeting Number: 143
Simultaneous Interpretation:   Yes

Internet et la collaboration internationale autour des points d'accès par sujet

Emma Place (née Worsfold)
Institut d'enseignement et de recherche technologique
Université de Bristol
Royaume-Uni


Abstract

Un certain nombre de bibliothèques européennes sont impliquées dans le développement des points d'accès par sujet sur Internet (Internet subject gateways), services qui visent à assister les usagers dans la recherche de ressources de qualité sur Internet. Voilà maintenant plusieurs années que des points d'accès par sujet comme SOSIG (SOcial Science Information Gateway) sont utilisables sur Internet : ils offrent une alternative aux moteurs de recherche comme Alta Vista et aux annuaires comme Yahoo. Les points d'accès par sujet se distinguent de ces derniers en ce qu'ils font appel aux compétences, aux pratiques et aux normes suivies par la communauté internationale des bibliothèques, qu'ils appliquent à l'information disponible sur Internet. Cette communication entend suggérer que les bibliothécaires jouissent d'une position idéale pour jouer un rôle majeur dans la création de services voués à la découverte des ressources de l'Internet et que les points d'accès par sujet sont une réponse à un tel objectif. Elle se propose de présenter dans leurs grandes lignes quelques-unes des initiatives qui se sont fait jour en Europe dans ce domaine et de décrire les outils et les technologies mis en jeu par le projet DESIRE dans le but de favoriser le développement de nouveaux points d'accès dans d'autres pays. On verra également comment le groupe IMesh travaille à la définition d'une stratégie internationale et à la promotion de normes destinées à encadrer le développement des points d'accès par sujet dans le monde entier.


Paper

Le contexte

"Le Web est en train de devenir rapidement le gisement de données
qui croît le plus vite au monde "

(Tim Berners-Lee, directeur de W3C et créateur du World Wide Web (WWW))

La profession de bibliothécaire vit une époque de bouleversement dans la mesure où Internet devient un vecteur majeur de l'information à l'échelle de la planète. Internet donne accès à une myriade de sources d'information mais le fait est qu'il est encore très difficile de repérer l'information de qualité au beau milieu du chaos général. Ces dernières années, le problème de la découverte des ressources de l'Internet a été au coeur des préoccupations et à l'origine d'un important travail de la part de nombreuses et diverses communautés.

Les moteurs de recherche

La découverte des ressources de l'Internet grâce à des moteurs de recherche comme Alta Vista et Excite repose sur des solutions automatisées. Ces derniers envoient des robots ou « Web crawlers » explorer l'Internet et indexent automatiquement les fichiers trouvés. Ces index peuvent ensuite être interrogés par mot-clé et renvoient à des références qui comportent, automatiquement générée, une description des ressources ; il s'agit le plus souvent des premiers paragraphes de la ressource elle-même. Les moteurs de recherche sont capables de trouver beaucoup d'information, une recherche débouchant souvent sur des milliers de ressources. Le volume des résultats peut cependant se révéler décourageant et peu exploitable à cause du bruit important : ils sont souvent trop abondants pour répondre aux besoins de l'usager.

Les annuaires du Web

Les annuaires du Web comme Yahoo et Open directory sont un peu l'équivalent pour Internet d'une bibliothèque de lecture publique qui ne serait pas tenue par des bibliothécaires ! Ils reposent sur un travail humain qui consiste à créer, à partir du World Wide Web, des répertoires listant les ressources Internet, chacune d'elles étant brièvement décrites et classées sous une rubrique thématique. Ces annuaires visent à décrire un grand nombre de ressources Internet, les sites sérieux tout comme les sites divertissants.

Le projet d'Open directory est remarquable puisque, en un sens, le grand public est invité à construire sa propre bibliothèque Internet en sélectionnant, classant et « cataloguant » les ressources. Open directory bénéficie de la force de travail gracieusement fournie par les éditeurs (actuellement, plus de 6 000 d'entre eux) qui passent du temps à enrichir l'annuaire de ressources et de descriptions de ressources (actuellement, plus de 100 000 !). Yahoo et Open directory ambitionnent tous les deux d'être les annuaires Internet les plus importants, atteindre un niveau élevé de couverture et attirer le grand public constituant leurs priorités.

Internet et les points d'accès par sujet

Les points d'accès par sujet offrent une alternative aux moteurs de recherche Internet et aux annuaires du Web. Quelle est la définition d'un point d'accès par sujet ? En un sens, ils sont l'équivalent pour Internet d'une bibliothèque universitaire ou spécialisée. Ce sont des services conçus pour aider les usagers à repérer de l'information de qualité disponible sur Internet. Ils constituent typiquement des bases de données recensant des métadonnées (ou notices de catalogue) qui décrivent de façon détaillée les ressources Internet et offrent un lien hypertexte avec ces ressources. Les usagers peuvent faire le choix d'interroger la base par mot-clé ou de butiner parmi les ressources sous des rubriques thématiques. Deux points essentiels caractérisent les points d'accès par sujet :

  • leur qualité est contrôlée
  • ils sont construits par des spécialistes du sujet et de l'information, souvent des bibliothécaires

Les procédés de sélection par la qualité

Des critères formels de sélection par la qualité sont utilisés pour guider le développement des collections de ressources recensées par les points d'accès. Des exemples de règles sélectives applicables aux points d'accès ont été réunis dans le cadre du projet DESIRE. DESIRE a également présenté en ligne un document didactique intitulé « Internet Detective » qui vise à enseigner les techniques requises pour évaluer la qualité des ressources de l'Internet : il donne un aperçu du type de travail effectué par les concepteurs de points d'accès lorsqu'ils évaluent et sélectionnent des ressources Internet.

La classification des ressources Internet

Les points d'accès utilisent des plans de classification afin de permettre aux usagers de parcourir la base. Nombre d'entre eux utilisent les plans de classification traditionnellement employés en bibliothèque comme la classification Dewey ou la classification décimale universelle. Une étude de l'usage des plans de classification au sein des services Internet a été menée dans le cadre du projet DESIRE : elle décrit cet usage de façon plus détaillée.

Les formats standards de métadonnées

Les formats standards de métadonnées sont utilisés pour décrire une ressource Internet référencée dans une base de donnée. Ces formats favorisent une recherche efficace de l'information à partir des bases de données mais garantissent également l'interopérabilité des points d'accès non seulement entre eux mais aussi, potentiellement, avec d'autres bases de données comme les catalogues informatisés de bibliothèque (OPAC). Ils prévoient également la possibilité de convertir et de passer d'un format à un autre, ce qui est important dans la mesure où les standards de métadonnées utilisés sur le Web sont appelés à se développer et à évoluer. En 1997, DESIRE a procédé à un bilan complet des formats de métadonnées. Au Royaume-Uni, l'Office of Library Networking (UKOLN) anime un groupe de travail « Metadata » qui poursuit des recherches quant aux formats de métadonnées, plus particulièrement en lien avec les formats de catalogage comme MARC. Son site Web propose des outils logiciels permettant le maniement des métadonnées et renseigne sur les possibilités de conversion entre les formats de métadonnées.

Les initiatives européennes en matière de points d'accès

Un certain nombre de points d'accès par sujet ont été développés en Europe et une importante communauté de bibliothèques engagées dans ce type de prestation se développe.

  • Royaume-Uni : le réseau RDN

    Au Royaume-Uni, un certain nombre de points d'accès thématiques ont été financés par l'agence gouvernementale pour le financement de l'enseignement supérieur (UK government's Higher Education Funding Council) et dépendent du réseau RDN (Resource Discovery Network). Tous les points d'accès britanniques sont basés dans les universités et nécessitent la participation des bibliothécaires et des professionnels de l'information :

    • SOSIG (pour les sciences sociales)
    • EEVL (pour les sciences de l'ingénieur)
    • OMNI (pour l'information biomédicale)
    • Biz/ed (pour le commerce et les sciences économiques)
    • History
    • ADAM (Art, Design, Architecture et Media)

  • Les Pays-Bas : DutchESS

    La bibliothèque nationale des Pays-Bas (Koninklijke Bibliotheek) a construit, en collaboration avec sept bibliothèques universitaires, un point d'accès par sujet appelé DutchESS (Dutch Electronic Subject Service) : il est national et couvre tous les sujets.

  • Finlande : le projet de bibliothèque virtuelle finlandaise

    En Finlande, le ministère de l'Education a financé le développement, à l'échelle nationale, de points d'accès thématiques. Le projet de bibliothèque virtuelle finlandaise a été lancé en 1995 et s'appuie sur la collaboration de huit bibliothèques universitaires.

  • Suède : EELS

    EELS couvre le vaste domaine de l'ingénierie électronique. Les six universités technologiques suédoises coopèrent dans le cadre de ce projet.

  • Danemark (et les autres pays nordiques) : NOVAgate

    NOVAgate couvre les domaines de la sylviculture, des sciences vétérinaires, de l'agriculture, des sciences de l'alimentation et de l'environnement. Il est produit par les bibliothèques - danoises, finlandaises, islandaises, norvégiennes et suédoises -, participant au réseau universitaire NOVA.

Le projet DESIRE

DESIRE est un projet international financé par l'Union européenne. Il vise à faciliter l'usage du World Wide Web au sein de la communauté européenne des chercheurs, un des moyens de réaliser cet objectif étant le développement et la promotion du modèle des points d'accès par sujet sur Internet. SOSIG, DutchESS et EELS sont tous partenaires dans le cadre du projet DESIRE et ont tous collaboré avec d'autres points d'accès (notamment le projet de bibliothèque virtuelle finlandaise et NOVAgate).

L'atelier DESIRE consacré aux bibliothèques nationales européennes

S'engager dans la voie des points d'accès thématiques représente une formidable opportunité pour la communauté des bibliothèques. Comme il a été montré précédemment, beaucoup de bibliothèques dans beaucoup de pays se sont déjà mises à la tâche, admettant la construction des points d'accès au rang de leurs attributions courantes. Une fois la structure du point d'accès mise en place au niveau national, les bibliothécaires des quatre coins du pays concerné peuvent collaborer au développement de la collection de ressources. Le modèle des points d'accès thématiques propose des méthodes stratégiques et standardisées pour parvenir à ce résultat. DESIRE entend soutenir le développement de nouveaux points d'accès en Europe et plus particulièrement celui des points d'accès ayant une envergure nationale. En septembre 1999, se tiendra, dans le cadre de ce projet, un atelier consacré aux bibliothèques nationales européennes : « Building national and large-scale Internet Information gateways : a workshop for the National Libraries of Europe ». A ce jour, dix-sept bibliothèques nationales européennes se sont inscrites pour participer à cet atelier, et nous espérons faire ensemble de grands pas en avant en vue de la construction d'un réseau européen de points d'accès.

L'Internet continue de connaître une expansion si rapide, qu'il est clair qu'aucun point d'accès isolé ou même national ne peut espérer cataloguer toutes les ressources disponibles sur ce réseau. Un modèle fondé sur le partage est requis, où chaque pays prenne la responsabilité de décrire les ressources de qualité disponibles sur son réseau national. Imaginez le scénario : des bibliothécaires de tous les pays travaillant à la construction d'une page unique donnant accès au meilleur de leurs ressources Internet nationales. Imaginez alors : il est possible d'interroger transversalement une combinaison de ces points d'accès afin de trouver des ressources Internet de qualité issues du monde entier. En fait, les technologies et les standards à même de concrétiser cette idée existent déjà et la communauté des bibliothécaires est parfaitement placée pour relever ce défi. Construire un réseau international de points d'accès prend du temps mais la communauté des bibliothécaires a à la fois la compétence et la responsabilité de développer ces précieux instruments de recherche sur Internet.

Un travail en réseau

Les points d'accès par sujet constituent un exemple réussi d'engagement de la communauté des bibliothèques dans la voie de la découverte des ressources de l'Internet. Les points d'accès déjà existants ont entraîné un effort dans le développement de systèmes favorisant le travail en réseau : un bibliothécaire peut oeuvrer pour un point d'accès, n'importe où dans le monde, pourvu qu'il ait accès à un PC en réseau et à un navigateur Web. Le catalogage partagé des ressources de l'Internet signifie que les bibliothèques peuvent participer à un service collectif au lieu d'avoir à construire chacune dans leur coin un service local. C'est une manière efficace de travailler - elle évite la démultiplication des efforts - et la collaboration signifie aussi que l'on peut développer des points d'accès à grande échelle, assurant une bien meilleure couverture. Beaucoup des points d'accès précédemment décrits bénéficient des contributions d'une équipe dispersée de bibliothécaires. Une étude de DESIRE, intitulée « Catalogage partagé et semi-automatisé », décrit les différents modèles suivis par des points d'accès déjà existants. Le logiciel ROADS permet le catalogage partagé grâce à une interface Web-base de données. Des références peuvent être ajoutées, supprimées ou remodelées à distance. Tout ce travail peut être effectué via le Web : les équipes peuvent travailler depuis leurs propres bureaux en utilisant leurs propres postes de travail et assurer ce service « Internet » à côté de leur travail habituel dans la bibliothèque.

Des bases de données distribuées

Les technologies à même de permettre l'interrogation transversale de bases de données hébergées sur des serveurs différents existent également. L'interopérabilité a fait l'objet de nombreuses recherches dans le cadre de DESIRE et de ROADS ou encore d'autres communautés. Si différentes bases de métadonnées peuvent être interrogées transversalement, cela offre à différentes communautés la possibilité de travailler à la description de différents secteurs d'Internet et, à l'utilisateur final, celle d'interroger transversalement et simultanément toutes ces collections. A une échelle nationale, les points d'accès britanniques et le projet finlandais de bibliothèque virtuelle oeuvrent chacun pour l'interrogation transversale de bases de données hébergées sur des serveurs différents. L'utilisateur final reste parfaitement ignorant de la complexe organisation sollicitée en arrière-plan de son interrogation : de son point de vue, il procède à une unique recherche à partir d'une unique page Web et obtient une unique page de résultats.

SOSIG et Biz/ed ont déjà introduit la recherche transversale dans leurs services. Lorsque les usagers interrogent SOSIG, ils interrogent en fait aussi la base de données Biz/ed : les résultats issus des deux bases de données s'affichent sur la même page. Les technologies utilisées pour atteindre cet objectif sont décrites dans un article publié par le magazine Dlib. Des bases de données localisées dans différents pays peuvent également être interrogées transversalement et simultanément : DutchEss (Pays-Bas) a travaillé en étroite collaboration avec SOSIG (Royaume-Uni) pour mettre au point un procédé d'interrogation transversale de sorte que chacune de ces deux collections sont accessibles simultanément par des utilisateurs des deux pays (et même d'ailleurs !). Il s'agit d'un travail pionnier et une fois qu'il aura été mené à bien, on espère que le même procédé sera utilisé par d'autres points d'accès pour mettre en place des systèmes similaires. Des démonstrations illustrant le travail mené dans le cadre de DESIRE et ROADS à propos de l'interrogation transversale sont disponibles sur le site Web de DESIRE.

Des outils pour la construction de points d'accès thématiques couvrant un large domaine

DESIRE développe des outils et des méthodes pour le développement de points d'accès thématiques couvrant une large partie d'Internet. Il collabore également avec les instances qui traitent de la normalisation tant pour les bibliothèques que pour Internet, afin de développer des pratiques standardisées, de garantir l'interopérabilité des points d'accès et leur aptitude à oeuvrer ensemble pour former des services se déployant à grande échelle et fondés sur la coopération.

Le guide DESIRE pour les points d'accès

Cette année, DESIRE publiera un guide d'information - « Information Gateways Handbook » destiné aux bibliothèques qui se préoccupent de bâtir leurs propres points d'accès thématiques, couvrant un large domaine. Le guide sera gratuitement accessible sur le World Wide Web et décrira toutes les méthodes et tous les outils requis pour la mise en place d'un point d'accès thématique couvrant un large domaine. Il s'appuie sur les résultats de trois années de recherches menées par DESIRE sur les points d'accès par sujet et inclura des études de cas et des exemples, dont beaucoup sont tirés des expériences précédemment évoquées dans cette communication. L'espoir est que ce guide assiste d'autres pays dans le lancement d'initiatives visant à la mise en place d'un point d'accès national, de telle sorte qu'un nombre grandissant de bibliothèques et de bibliothécaires commencent à jouer un rôle dans la découverte des ressources de l'Internet.

ROADS

ROADS est un assortiment d'outils logiciels permettant la mise en place et l'entretien de points d'accès thématiques basés sur le Web. Il a été développé dans le cadre du programme britannique pour les bibliothèques électroniques (UK's Electronic Libraries Programme) mais est gratuitement proposé à l'usage de tout un chacun. Le logiciel intègre la technologie de la base de données requise pour mettre en place un point d'accès, le principe de l'administration centralisée requis pour faciliter le catalogage à distance via le World Wide Web et tout ce qui est nécessaire au fonctionnement du point d'accès. Beaucoup des points d'accès précédemment évoqués utilisent ROADS, notamment SOSIG et le projet de bibliothèque virtuelle finlandaise. La panoplie ROADS, composée de logiciels dont la source est libre, est produite par un groupe de concepteurs experts dans l'identification, l'indexation et le catalogage des ressources basées sur le réseau. Il en est résulté une approche fondée sur les standards, attentive à la compatibilité du développement logiciel avec les exigences courantes et nouvelles de l'indexation et du catalogage. J'ajoute qu'il existe en ligne une abondante documentation pour ceux qui s'intéressent à l'utilisation du logiciel, soit à des fins expérimentales, soit en vue de fournir un service.

Imesh : points d'accès et communauté internationale

IMesh est un réseau de coopération rassemblant la communauté des acteurs-clés engagés dans le développement des points d'accès thématiques, dans le monde entier et pas seulement en Europe. Il est probable qu'IMesh jouera le premier rôle dans le développement futur des points d'accès à l'échelle internationale.

IMesh a été créé à la suite d'une rencontre organisée dans le cadre de la Seconde conférence européenne sur la recherche et la technologie pour les bibliothèques numériques, qui s'est tenue en Crète en septembre 1998 et à laquelle ont assisté 25 représentants de 15 pays. Un des principaux objectifs d'IMesh est d'explorer les possibilités d'un développement international des points d'accès, fondé sur la coopération. Entreprendre la création d'un point d'accès signalant le meilleur de l'Internet issu de tous les pays, dans toutes les langues et dans tous les domaines, réclamerait de la part d'un pays isolé un investissement considérable en énergie et en moyens. Le groupe Imesh examine dans quelle mesure l'effort peut être réparti par le biais d'accords internationaux de coopération. Beaucoup des technologies requises pour l'interrogation transversale de différents points d'accès et pour le catalogage à distance dans le cadre des points d'accès existent déjà. Ce qui fait défaut, c'est une stratégie qui organise les points d'accès : IMesh entend s'attaquer à ce problème. Le rapport de cette manifestation expose dans leurs grandes lignes les principales questions auxquelles le groupe se propose de répondre. En juin 1999, le premier atelier d'IMesh se sera tenu à Warwick, au Royaume-Uni, et aura rassemblé des concepteurs de points d'accès du monde entier. J'espère exposer les résultats de cette rencontre lorsque je présenterai cette communication à la conférence de l'IFLA. Il existe une liste de discussion IMesh : ceux qui s'intéressent à la coopération internationale en matière de points d'accès thématiques sont invités à la rejoindre. La liste fournit un espace ouvert à l'échange des idées et des technologies susceptibles de promouvoir le dynamique créée autour du point d'accès par sujet. Des détails sont disponibles sur le site Web IMesh.

Conclusions et prospective

A bien des égards, Internet ressemble encore à un chantier ! Beaucoup de choses sont encore en construction, y compris l'architecture basique du Web. Le consortium World Wide Web travaille encore à l'édification d'une structure capable de favoriser la découverte des ressources de l'Internet. Il a récemment sorti un modèle de description des ressources assorti de spécifications syntaxiques - Ressource Description Framework (RDF) -, qui vise à doter le Web d'une infrastructure de base permettant le transfert et le traitement des métadonnées. Ceci marque le début d'un nouvel âge pour le Web dans la mesure où tout un chacun est autorisé à « cataloguer » une ressource du Web en un langage compréhensible pour la machine. Différentes personnes voudront utiliser RDF dans différents pays : c'est tout simplement la structure grâce à laquelle différentes personnes peuvent travailler. Les concepteurs de points d'accès réfléchissent actuellement avec W3C à la manière dont RDF pourrait soutenir ces précieuses collections de métadonnées. Potentiellement, les bibliothécaires pourraient jouer sur Internet le même rôle que celui qu'ils ont traditionnellement tenu : pourvoyeurs d'information, intermédiaires fiables, sur lesquels l'utilisateur final peut compter lorsqu'il est à la recherche d'information.

Si la structure de la bibliothèque Internet est encore lacunaire, cela ne signifie pas pour autant que les bibliothécaires doivent attendre pour commencer à construire leurs collections Internet. Les réseaux humains requis pour cataloguer efficacement l'Internet mettront plusieurs années à se mettre en place. Les bibliothèques peuvent travailler à la création de métadonnées signalant les ressources Internet et à trouver leur place dans la communauté des producteurs de métadonnées. Elles peuvent aussi commencer à se familiariser avec les nouvelles métadonnées et normes du catalogage Internet afin de rendre toutes les références compatibles. Bien que cette communication soit présentée à la Section « technologie de l'Information » de l'IFLA, les technologies sont, à bien des égards, le moindre de nos soucis : c'est l'élément humain qui requiert à présent un développement significatif.

DESIRE et IMesh espèrent faciliter l'engagement d'une communauté plus large de bibliothèques dans la voie de la découverte des ressources Internet. Dans cette communication, j'ai décrit des services qui ont déjà suscité la participation d'un grand nombre de bibliothèques et de bibliothécaires. L'IFLA peut peut-être nous aider à mettre ce travail en avant et à promouvoir le rôle du bibliothécaire vis-à-vis d'Internet comme un nouveau rôle important à tenir pour la profession.

The Open Directory Project
http://dmoz.org/Computers/Internet/WWW/Directories/Open_Directory_Project/

Selection Criteria: Examples
http://www.desire.org/results/discovery/cat/selectex_des.htm

Internet Detective
http://www.sosig.ac.uk/desire/internet-detective.html

The Role of Classification Schemes in Internet Resource Description and Discovery
http://www.desire.org/results/discovery/cat/class_des.htm

A Review of Metadata: a Survey of Current Resource Description Formats
http://www.desire.org/results/discovery/cat/meta_des.htm

UKOLN Metadata Web Page
http://www.ukoln.ac.uk/metadata/

EEVL (Edinburgh Engineering Virtual Library)
http://www.eevl.ac.uk/

OMNI
http://omni.ac.uk/

Biz/ed
http://www.bized.ac.uk/

HISTORY
http://ihr.sas.ac.uk/

ADAM
http://www.adam.ac.uk/

DutchESS (Dutch Electronic Subject Service)
http://www.konbib.nl/dutchess/

The Finnish Virtual Library Project
http://www.uku.fi/kirjasto/virtuaalikirjasto/

EELS
http://www.ub2.lu.se/eel/eelhome.html

Building National and Large-scale Internet Information Gateways: a Workshop for the National Libraries of Europe (DESIRE)
http://www.desire.org/html/subjectgateways/workshops/workshop1.html

Distributed and Part-Automated Cataloguing (DESIRE)
http://www.sosig.ac.uk/desire/cat/cataloguing.html

Cross-Searching Subject Gateways: The Query Routing and Forward Knowledge Approach (D-Lib Magazine, January 1998)
http://www.dlib.org/dlib/january98/01kirriemuir.html

DESIRE Cross-searching Demonstrator
http://www.desire.org/ROADS/cgi-bin/search.pl

ROADS
http://www.ilrt.bris.ac.uk/roads/

D-Lib report from the Crete ECDL'98 Subject Gateways meeting
http://www.dlib.org/dlib/october98/10clips.html#GATEWAYS

IMesh: International Collaboration on Internet Subject Gateways
http://www.desire.org/html/subjectgateways/community/imesh/

W3C (World Wide Web Consortium)
http://www.w3.org/

*    

Latest Revision: July 27, 1999 Copyright © 1995-2000
International Federation of Library Associations and Institutions
www.ifla.org