互操作联邦数字图书馆研究
【内容提要】未来的图书馆将是联邦数字图书馆,其目标是向用户提供一个将异构、分布信息源无缝集成的视图,实现对数字图书馆资源的透明访问。文中首先介绍了研究数字图书馆互操作的必要性,在此基础上重点分析讨论了联邦数字图书馆的实现方法,并对当前具有代表性的互操作联邦数字图书馆的研究进行了综述讨论,最后简单讨论了目前建立互操作联邦数字图书馆所面临的挑战及进一步研究和解决的问题。【摘 要 题】专题探讨……
1 研究数字图书馆互操作的必要性
随着在线数字图书馆(DLs)的日益增多,人们发现必须访问许多DLs才能找到所需要的资料。由于大多数DLs是基于数据库驱动的,现有流行的搜索引擎不能对其内容建立索引。因此,对于那些需要跨越多个DLs查找资料的用户来说,搜索引擎不能满足这种需求。如何将广泛分布的、异构的DLs联合起来向用户提供统一的服务,即实现DLs之间的互操作,成为DLs研究与开发所关注的中心问题。
所谓数字图书馆的互操作是指交换和共享DLs的文档、查询和服务的能力[1]。它要求来自技术(协议和格式等)、内容(元数据及其语义等)和组织(DLs的基本访问原则、支付方式和认证等)三方面的合作。DLs的互操作可以出现在不同的抽象层次上,我们可以将其概括为两类视图[1]:纵向视图(vertical view)和横向视图(horizontal view)。前者涉及法律、社会、文化和知识产权等方面的问题,后者涉及DLs的硬件和软件即体系结构方面的问题。
为什么要研究DLs的互操作?道理很简单:目前很少有DLs既提供丰富的馆藏资源,又提供有效的服务。尽管目前一些DLs拥有大量的馆藏资源,而另外一些DLs却提供许多的服务,但在这两种情况下,用户都不太容易找到其所需要的信息资源。只有在这些DLs之间实现互操作,才能共享DLs的资源和服务。因此,研究DLs的互操作是十分必要的。
2 联邦数字图书馆的实现方法
为了解决用户使用DLs查找资料时同一查询条件的重复提交问题,人们提出了联邦数字图书馆的概念。所谓联邦数字图书馆是指正式或非正式合作操纵DLs的一些组织,它们同意支持一组共同的服务和标准,以便在联盟成员之间共享DLs的资源,实现互操作。联邦数字图书馆允许跨越不同的DLs执行搜索,并将每个DLs的查询结果合并后返回给用户,使用户感到如同使用单个数字图书馆一样。从联邦的耦合度考虑,实现联邦数字图书馆的方法可分为以下三种:NCSTRL方法、Harvesting方法和搜集(Gathering)方法。
2.1 NCSTRL方法
网上计算机科学技术报告图书馆(NCSTRL)是一个拥有100多个机构加盟的联邦数字图书馆[2],它利用Dienst作为DLs的协议和体系结构。凡是要求加入NCSTRL的机构需要在本地安装Dienst服务器,并按照统一规定的数据格式建立其馆藏资源。NCSTRL借助于分布式搜索技术在联盟DLs之间实现资源共享,它将用户的查询送往参与联邦的所有DLs上分别执行,收集返回的结果,综合整理后返回给用户(图1)。
附图
图1 NCSTRL方法
NCSTRL方法要求所有参与联邦的DLs使用相同的协议或软件系统,因此能够提供全面的互操作。但紧密的联邦必将加重联盟成员的负担,它们不得不就技术标准和策略(如知识产权准则、安全和隐私等)达成一致。从网络和搜索系统方面的限制考虑,NCSTRL是昂贵的运行模式,因为要求每个联盟成员的DLs必须支持复杂的查询语言和对查询的快速实时响应。另外,从查询的频率、元数据的质量以及网络资源的可用性等方面综合考虑,这种实现联邦的方法对联盟成员加负较重。因此,只有那些需求强烈的DLs会采用这种代价较高的模式。
[1] [2] [3] [4] [5] [6]