美章网 资料文库 国内外机构知识库建设研究范文

国内外机构知识库建设研究范文

时间:2022-10-12 04:49:44

国内外机构知识库建设研究

《情报理论与实践杂志》2015年第九期

机构知识库(InstitutionalRepositories,IR)是利用网络及相关技术,依附于特定机构而建立的数字化学术数据库,它收集、整理并长期保存该机构及其社区成员产生的学术成果,并将这些数据进行规范化处理、分类,在遵守相应的开放标准和互操作协议下,允许机构以及其社区内外的成员通过互联网免费获取使用[1]。对于成立机构来说,机构知识库不仅使成立机构对智力成果的管理能力增强,而且能够使学术成果得到展示和保存,提升机构的影响力和学术地位。另外,它充分显示了规模经济的作用,即机构知识库对信息的整合有利于知识的产生,对机构数字成果的收集和保存可保障学术界对其知识的长期获取,平衡机构内的知识资本。目前国内外对机构知识库都进行了大量的研究,但国内对于知识库的研究主要集中在微观层面,大部分只针对国内知识库的某一方面进行论述,如管理服务、政策、模型等,或者只分析国外机构知识库的发展状况,而通过对国外机构知识库现状进行分析,借鉴国外成熟机构知识库的经验,来分析我国机构知识库的发展这方面的研究却不多。2010年,万文娟等主要从机构知识库的资源数量、类型、学科分布的差异来分析其异同,并提出相应措施[2];肖希明通过国外几个成功范例,指出我国机构知识库存在的问题,并提出针对性措施[3]。2011年,赵莉娜通过对ROAR统计数据,介绍了国外基本情况,重点分析了我国的建设现状并提出建议[4];乔欢比较综述了国内外机构知识库内容建设的相关研究[5]。本文通过OpenDOAR、ROAR、CybermetricsLab的机构知识库排名以及国内外相关机构知识库网站的调查统计,从不同角度分析当前世界范围内机构知识库的建设现状以及英、美、日等国家机构知识库建设的特色,并针对目前我国机构知识库建设的问题及不足,提出相应的建议。

1世界机构知识库发展现状

IR是20世纪90年代末随着开放存取的兴起而出现的一种学术交流与资源共享的新模式。2002年,Dspace系统问世,世界范围内出现了大规模机构知识库的建设,并且很多国家已经取得了显著成效。截至2007年3月,OpenDOAR上收录的机构知识库仅有853个[6];截至2010年8月30日,OpenDOAR就收录机构知识库1714个,ROAR收录机构知识库1625个[2];而截至2014年11月1日,OpenDOAR收录机构知识库2728个[7],ROAR收录机构知识库3216个[8]。由此可见,近十多年来全球范围内机构知识库发展迅速。根据ROAR统计数据,图1显示了机构知识库各大洲分布情况及集中分布地区。在世界知识库的分布中,欧洲的机构知识库数量所占比例最大,其次是北美洲,亚洲居于第三。通过进一步分析发现,在这些所占比重较大的大洲中,其知识库分布的国家也是比较集中的。如北美洲83%的机构知识库集中于美国;欧洲虽然国家数量较多,但是由图1发现,17%的机构知识库来自于英国,德国占14%,西班牙占11%,其他国家所占比例较少;日本领先于亚洲其他国家和地区,占25%;中国的大陆以及台湾,还有印度的机构知识库的数量在亚洲也占有一定的比例。根据ROAR结合西班牙CybermetricsLab的RankingWebofRepositories按照规模、能见度、丰富性和学术性把世界机构知识库进行的排序[9],本文选取了综合排名前200位中所占数量最多的机构知识库进行统计。由表1和图1可知,英国、美国、德国和西班牙不仅仅在数量上领先于其他国家,在机构知识库建设的质量上也处于领先地位。然而,数量上排名居于前10位的国家和地区中,中国大陆、印度和波兰没有排名前200位的机构知识库,可见这些国家和地区的机构知识库建设质量有待提升。同时,这也反映了世界机构知识库不仅在数量的分布上比较集中,而且在建设质量上发展也不平衡。所以出现了这样一种局面,即一些国家和地区的机构知识库无论从数量上还是发展水平上都处于领先地位,而另一些国家和地区的机构知识库数量极少,或者数量虽然可观,但是发展水平较低,不能有效发挥机构知识库的作用。由于欧洲、美洲的一些国家机构知识库建设起步较早,有较成熟的建设体系及经验,所以在发展数量和发展程度上要领先于其他地区。世界机构知识库分布过于集中以及发展不平衡的现状,不利于世界范围内的开放存取,甚至有可能进一步拉大地区间的差距。然而机构知识库发展相对落后的国家,可以通过这些集中且成熟的机构知识库,进行国内外机构知识库的发展状况的研究,分析先进国家机构知识库发展特色,借鉴其发展经验,如美国、英国和日本等,进而建设和完善符合本国国情的机构知识库。

1.1世界机构知识库软件应用情况随着机构知识库在各个国家的发展,机构知识库长期发展的技术保障也在迅速发展,比如开发的应用软件种类在迅速增长。选择较成熟、友好、个性化的系统软件是机构知识库建设不可或缺的重要因素,它的界面是否友好,用户使用是否方便等都决定着机构知识库是否能被大众所接受[10]。机构知识库所用的开发软件主要可分为开源软件、自行研发软件和商业软件3种。由于开源软件具有免费使用和授权操作简单的优势,只要机构知识库显著位置标注使用软件标徽,并加上网站所有者链接就可以供单位和个人使用,所以全球机构知识库多选此类软件[11]。OpenDOAR所统计的软件共有150多种,ROAR主要统计了30多种开源软件,下面分别列出这两个网站所统计的应用最广泛的前10位软件。由表2可知,虽然OpenDOAR和ROAR的统计具有一定的差异性,但可以看出当前世界机构知识库应用最广泛的开源码软件是Dspace、Eprints和Bepress,并且它们的使用率之和超过70%。与2010年软件总数50多种相比,机构知识库的应用软件数量增长迅速,这与各国各地区为满足自身的需要而开发软件的实际情况密不可分。这些软件无论在设计原则上还是应用目标上,都各具特色,为不同机构知识库的建设提供了更多可选择的技术平台。另外,在OpenDOAR统计的150多种应用软件中有很多软件只有一个或少数机构知识库使用,反映了目前各机构独自开发的知识库软件正在兴起。例如,在按门户网站排名世界机构知识库的名单中位居第一的法国HAL-INRIA(INRIAaCCSDElec-tronicArchiveServer)[12]使用了HAL软件,此机构知识库主要针对计算机科学方面的研究,除了具有精致的界面和英法文阅读,提供基本检索和高级检索以外,还具有RSS、新沉积报警、数据统计显示和归类的出版名单的功能。HAL软件共有28个机构知识库使用,是法国开发的一款独具特色的软件,目前英国的机构知识库也有此软件的应用;另外,位居第三的美国SAO/NASA天体物理学数据系统(ADS)所使用是单独开发的HS-DVL软件[13],此软件的开发主要针对天文学和物理学方面的研究人员,并且ADS是唯一使用此软件的系统,它包含天体物理学、物理学和arXiv电子出版物三方面数据1110万条记录。

1.2世界机构知识库建设和服务模型机构知识库的建设是推进知识服务的基础之一,其建设和服务模型能保障将有效的资源进行整合,并提供优良的知识化服务,使每个机构知识库独具机构特色和学术特色。笔者根据国外机构知识库建设比较成熟国家的案例,如美国、日本等,对机构知识库的构建及服务模型进行了总结,发现机构知识库的系统结构总体分为3层:采集层、处理层和服务层,虽然基本框架大同小异,但是在每个机构知识库的构建过程中,框架内容却独具特色(如图2所示)。第一层,采集层,主要采集内容数据和有关元数据,注重数据的来源和种类。从数据来源看,以美国加州大学的eScholarship为例[14],它在采集层的主要特色是有着格的作者提交系统并且收集除作者提交以外的其他内容来源。首先,作者通过提交系统或者规定的开放期刊系统(OJS)提交自己的内容,然后进行内容评审,此过程是以管理员审核或者同行评审的形式进行的,最终审核通过或刊载的内容就会在机构知识库保存并发表。其次,对于很多机构知识库来说,内容的主要来源是机构作者提交,eScholarship还有其他内容来源———开放获取出版社(Bi-oMedCentral)和电子学位论文服务(UCETDs)的数据,这些都保证了数据来源的质量和数量。此外,从采集数据种类上看,除了eScholarship等大多数存储相关学术论文之外,哈佛大学的DASH(DigitalAccesstoScholarshipatHarvard)[15]和北得克萨斯州大学(UNT)[16]的电子图书馆,鼓励存储与手稿相关的资料,包括数据、图片、声视频文件等,提供了更多灰色数据和隐性数据,扩大了科学数据范围,满足了科研用户更高层次的需求。第二层,处理层,主要涉及数据处理及存储的过程。采集数据后,为方便存取,要对数据进行相应的处理转化,形成统一格式,如文本提取、文字识别、建立索引、生成图像等,然后通过门户网站为用户提供便利服务。笔者通过调查一些国外机构知识库发现,很多机构知识库由于遵循了OAI-PMH协议,被专业搜索引擎所收录,扩展了资源检索途径。在这方面日本做得比较突出:大阪大学[17]机构知识库的主页提供了Jairo(JapaneseInstitutionalRepositoryOnline)和Oaister站外搜索;北海道大学[18]则提供了更多的站外检索:谷歌/谷歌学术搜索、CiNii、JAIR、Worldcat、NDLTD;长崎大学[19]的站外检索有Scir-us、Oaister、CiNii。相反,通过这些站外检索也可以检索到本机构知识库的资源,这样一方面为用户检索提供了方便,另一方面也提高了机构知识库的知名度。eScholarship还把数据存储于加利福尼亚电子图书馆(CDL)数据保存库,保证了数据更大限度的开放获取,实现真正的利用价值。第三层,服务层,包括基本服务、扩展服务、知识服务和增值服务。基本服务包括对数字资源的内容组织、长期保存、信息浏览和检索以及对互操作协议的支持;扩展服务指机构知识库要满足学术交流、科研辅导、教育服务的需求;知识服务指个性化服务和嵌入式服务;增值服务指知识发现服务和分析评价服务。对于目前大部分机构知识库来说,都做到了基本服务和扩展服务,部分机构知识库的个性化服务以及知识发现服务也逐步完善。其中嵌入式服务是一种以用户为中心的全新服务理念,要求机构知识库通过多种方式融入到成员的信息环境,与学科服务结合,使学科服务一同嵌入到成员的教学科研环境中[20]。例如,美国NASA(TechnicalReportsServer)以及明尼苏达大学的电子数据库(UMDC)、加州大学的eScholarship,提供了Facebook、Twitter和YouTube等社交网络平台的链接,加强了用户知识交流和互动的支持,扩展了用户信息交流空间,促使隐性知识的激活。分析评价服务是从不同的维度,如范围、类型、时间等,根据知识库内资源利用情况,开展科学的同行评议和学术影响价值分析,并通过可视化的形式展示分析评价结果,以满足科研工作者的需要[21]。目前大部分的世界知识库门户网站都提供本月下载量排行榜、总下载量、最新上传等基本统计数据,有的还展示作者详细资料、提供引用链接服务、发展引用分析服务等。

1.3国外机构知识库相关政策制定情况在开放存取知识库目录OpenDOAR中,将机构知识库的政策分为元数据复用政策、数据复用政策、内容政策、提交政策和保存政策,并且对各机构知识库的政策制定情况进行了不完全统计。截至2014年11月的数据,2728个注册成功的机构知识库中,对世界范围、英国、美国及中国的相关政策制定情况进行统计(如表3所示)。由表3可知,相对于近年来机构知识库数量的突飞猛涨,世界范围内机构知识库政策的制定比例并不高,可见大部分国家对此并没有充分重视。美国知识库政策制定比例整体来看仅稍高于世界平均水平,但通过调查其中很多知识库的政策都很具代表性。例如,康奈尔大学的E-Commons@Cornell制定的内容政策中明确规定了存储内容的类型、格式、大小和所有权4个方面,其中保存政策包含了提交方式、提交者的定义、数据质量以及版权问题[21];而剑桥大学的Despace@Cambridge对内容政策中重点提出对内容质量的要求,还有单独的提交政策,对提交过程及提交人所涉及的版权问题均作出了明确规定[22]。此外,还有些知识库涉及使用政策、隐私政策、撤回政策等的规定。相比之下,英国表现尤为突出,远远超出了世界平均水平。据OpenDOAR统计,英国机构知识库数量为228,大部分是由资助机构赞助和大学组成的非盈利性质的机构知识库,其中制定元数据复用政策的机构知识库中有70家是非盈利性质的,约占31%,22家是盈利性质的,约占10%;制定数据复用政策的机构知识库有44家是非盈利性质的,约占20%,仅1家是盈利性质的,约为0;另外有111家制定了提交政策,约占50%;59家制定了保存政策,占26%。这些数据反映了英国机构知识库政策在机构层面的建设比较突出,也显示出资助机构和大学对政策制定的重视。通过利用制定的政策采取有效措施,充分发挥了机构知识库学术交流的作用,这也是英国在机构知识库政策方面呈现积极态度的主要原因。

2我国机构知识库建设存在的问题及建议

2.1我国机构知识库建设存在的问题1)我国机构知识库目前在数量上虽然发展迅速,但是建设程度差别较大,失衡问题严重。大陆机构知识库整体建设水平不高,影响力远远不及英美日等发达国家。但是,相对而言,我国的台湾及香港地区的机构知识库建设水平还是相当高的,不仅数量多,而且质量高,影响力较大。根据西班牙CybermetricsLab的RankingWebofReposi-tories显示,香港大学的机构知识库排名第54位,相比2010年的统计数据[9],是我国机构知识库综合发展最快的。另外,在世界排名前500的机构知识库中,我国台湾地区有7个,台湾大学排名第109位,成功大学排名176位,政治大学排名195位,是我国机构知识库综合质量最高的地区,而大陆排名第一的厦门大学世界排名第700位。可见台湾和香港地区的机构知识库建设无论在数量规模还是在宣传推广和技术保障上都取得了显著的成绩,相比而言,大陆的机构知识库虽然在数量上增长较快,但是仅处于建设的初级阶段,没有完备的体系、政策支撑,建设水平亟待提升。2)我国机构知识库使用的软件平台种类及功能单一,且本地化程度低。软件平台的类型决定机构知识库存储对象的种类、存储对象的互动性、安全性以及提供服务的多种能力等[23]。目前世界机构知识库建设所使用的软件主要分为两大类:一是使用专用机构知识库建设软件(开源软件和商业软件);另一种是自行开发专用软件用于特定或小范围的机构知识库开发建设。由于我国机构知识库建设起步晚,技术力量薄弱,通过OpenDOAR统计,除了奇迹文库的自开发软件、香港中文大学使用的Drupal、岭南大学使用的DigitalCommons、台湾中央大学使用的ETD-db,以及中国科学院在Dspace的基础上根据自身要求进行深度开发了CSpace系统以外,主要使用的是开源软件Dspace,而且大多直接采用Dspace默认设置(浙江大学等),或只是简单对Dspace进行本地化(厦门大学),致使我国机构知识库软件平台功能显得十分单一,缺乏个性化。3)在国外知识库机构的建设向服务纵深型模式发展的背景下,我国机构知识库服务模式存在很大问题,主要有:①提供的服务资源类型有限,不能满足科研工作者研究和创新性学习的需要。大部分的机构知识库收藏的资源类型主要是期刊论文、会议论文和学位论文等,图像、多媒体等复合数字资源则收集的较少。例如,中国科学院力学研究所机构知识库虽然有演示报告(视频)、图像集、网页、软件等内容类型,但是内容数量较少,且发表时间间隔长,如图像类型资源2000年发表5项,到2013年一直为空白期,剩余内容发表日期均为2014年,同时又反映了该知识库开始重视此类数据的收藏。②服务功能有限,大部分机构知识库以基本服务功能为主,虽然提供个性化推送服务但是过于简单,没有对用户的需求进行更深入挖掘。信息交流空间缺乏,充其量只是一个数据库,科研用户之间不能像外国一些知识库一样通过如社交网络平台、讨论组等形式进行有效的学术交流。4)缺乏有力的政策支持仍然是我国机构知识库建设发展的瓶颈问题。2005年6月,在北京召开的“科学信息开放存取战略与政策国际研讨会”[24],表明了我国对开放存取政策的相关研究是非常重视的。但是2010年10月,在北京举办的“第八届开放存取柏林国际会议”上,中国科学院机构知识库负责人指出机构知识库建设过程中政策支持仍为最大缺陷,并且此问题至今仍未解决。据OpenDOAR统计,目前我国的机构知识库政策与相关发达国家相比显得较为滞后,且实施力度不大。由于各种政策的出台是漫长的,加之我国机构知识库发展起步较晚,我国在宏观政策的制定上显得较为滞后。机构知识库研究者能够直接参与的政策仅仅是机构层面,研究相关政策制定的热度很高,但实际应用很少。我国虽然在微观政策上的建设方面有所发展,但是相当数量的机构知识库管理者在确定了政策基本框架后却没有及时进行具体政策规定的补充,鉴于国内外机构知识库政策建设现状,我国很有必要进一步建设与完善适合机构知识库长期发展的政策体系。

2.2我国机构知识库发展建议机构知识库的建设是一项系统工程,要保证其健康持续发展,需要从改变对机构知识库的认识,完善相关机制,革新技术,加强服务功能的完善等多层面出发。笔者认为在机构知识库建设的过程中,宣传工作是前提,政策体系是保障,技术革新是动力,服务完善是目的。针对我国机构知识库目前存在的问题,笔者提出了以下几方面的建议:①坚持基本原则———开放存取,扩大开放存取的宣传工作,加强宣传和推广,鼓励广大科研人员及相关用户积极投稿和使用,使开放存取理念深入人心,充分发挥机构知识库的作用。②结合我国国情及机构知识库自身特点,借鉴机构知识库政策体系比较完善发达的国家的经验,如英国、美国等,制定适合我国机构知识库长期发展的完整政策体系。③自主开发软件与使用国外比较成熟的软件相结合,一方面根据我国目前机构知识库建设状况,开发适用于我国机构知识库的软件;另一方面在利用国外成熟机构知识库软件的同时,要从信息交换、Web界面和索引等方面加强软件系统的汉化水平,使之符合中文用户需求,解决本地化应用问题。④立足“服务”理念,以用户为中心,完善资源存储类型,完善服务功能,除了使机构知识库具备一般检索、浏览以及个性化推送功能以外,还应具备引用链接服务、嵌入式服务、学术交流服务等功能。

3结束语

在机构知识库备受关注的今天,我国机构知识库虽然在数量上增长迅速,但是机构知识库的建设完善程度及使用效果层面上来讲却仅仅处于初级阶段。纵观国内外机构知识库建设情况,我们应该在建设机构知识库中不断总结经验,并借鉴国外机构知识库建设的成功之处,从多个层面出发,建设有中国特色的机构知识库,使其真正成为科研和学术交流的有效平台。

作者:陈美华 刘文云 刘昊 王静雅 单位:山东理工大学 科技信息研究所

被举报文档标题:国内外机构知识库建设研究

被举报文档地址:

https://www.meizhang.comhttps://www.meizhang.com/kejizazhi/qbllysjzz/680132.html
我确定以上信息无误

举报类型:

非法(文档涉及政治、宗教、色情或其他违反国家法律法规的内容)

侵权

其他

验证码:

点击换图

举报理由:
   (必填)