美章网 资料文库 档案社会化媒体现状及信息整合范文

档案社会化媒体现状及信息整合范文

时间:2022-11-12 06:49:36

档案社会化媒体现状及信息整合

一、档案社会化媒体研究的现状及方法

1.研究档案社会化媒体的现状进展关于档案社会化媒体的研究,一些学者在阐释休闲利用观的基础上介绍了国外档案利用服务社会化的理论研究和实践情况,在设计档案社会化媒体信息资源整合的基本框架时对档案社会化媒体研究进行了初步探讨,在业务层面讨论了网络环境下影响我国档案利用的行为因素,从“用”和“管”的角度对国内外几个主流社交媒体相关研究文献的研究情况进行了综述分析。近年来,档案社会化媒体成为一个新兴的、快速发展的研究应用领域。作为交叉研究领域,档案社会化媒体研究一方面受到学界的争议,另一方面也受到研究成果少、理论基础薄弱、研究人员缺乏、相关技术手段不足等多方面的限制。社会化媒体与档案学的结合,一方面给社会化媒体的发展拓宽了渠道,另一方面为档案事业的发展注入了新的活力。为掌握国内档案社会化媒体研究现状及发展趋势,需要利用软件工具对学术期刊数据库和新媒体资源中的相关资料进行数据采集分析,以期为深入研究档案社会化媒体构建“大数据”,也为该研究领域的进一步发展提供参考借鉴。

2.研究档案社会化媒体的方法步骤针对国内相关档案社会化媒体的期刊文献进行分析,以期有一个较为全面的把握。研究主要利用了Citespace、Ucinet、Bicomb2、SPSS22和Excel等软件工具,对2007年以后的国内档案社会化媒体领域464篇期刊论文进行分析。方法步骤概述如下:(1)通过专业检索式检索相关期刊文献,并通过CNKI自带导出功能,选择refworks及endnote2种方式,将经过人工筛选的样本论文题名、作者、关键词等数据导出为文本文件格式保存;(2)通过书目共现分析系统Bicomb2软件对所需数据进行提取统计,并以Excel格式进行保存,运用Citespace等工具对数据进行多方面分析探讨;(3)通过Bicomb2构建共词矩阵,借助Ucinet绘制关键词知识图谱,并将共现矩阵转换成二值矩阵,进行k-核分析;(4)基于ochiia系数将共词矩阵转换为相异矩阵,将相异矩阵导入SPSS22进行聚类分析,并对核心—边缘关键词进行标注;(5)根据分析结果,聚焦出国内档案社会化媒体领域的研究热点;(6)基于战略坐标理论对热点主题进行分析。

3.研究档案社会化媒体的数据来源鉴于中国知网具有较高的权威性和数据可靠性,而且期刊文献更新速度较快,能够较好地反映一个领域的最新研究成果及发展趋势,因而选择中国学术期刊网络出版总库为样本数据来源,检索时间为2018年1月12日,基本检索式构成为:SU=(社会化媒体+社交媒体+微博+博客+微信+社交网站+新媒体+自媒体+web2.0+web3.0+webarchive+网页归档)*(档案+档案信息+档案工作)。为保证有较高检准率和检全率,又在该基本检索式上构建了多条辅助检索式。经过多次试验,选择得到667条记录,经过人工筛选,对结果进行去重、删除无效条目,最终得到464篇相关文献作为样本。对发文量进行处理生成发文量趋势图,表明近10年有关档案社会化媒体的文献总体呈现缓慢增长的趋势,是社会化媒体引入档案领域的初始阶段。其中,一些论文介绍了Web2.0的概念、特点及主要应用,介绍了借鉴先进思想理念拓展档案信息服务的方法,介绍了美国网络归档项目及进展情况,这是国内较早把社会化媒体引入档案研究的文献。分析还发现,发文量10年里从12篇上升到133篇,呈“J”形增长趋势,表明这一研究领域已经进入到一个发展上升期,可以推测今后几年里,档案社会化媒体领域的研究仍然是一个研究热点。

二、档案社会化媒体文献要素的知识图谱分析

1.作者群及活跃作者信息的知识图谱课题组对文献机构—作者的聚类进行图谱分析,图谱中用节点大小反映研究机构研究成果的数量,用颜色反映研究的活跃程度。结果是:目前档案社会化媒体领域的活跃研究团队主要有以中国人民大学、上海大学为中心的研究团队,以南京大学和西北大学、安徽大学为主的研究团队,其他的活跃研究机构包括原南京政治学院、山东大学、河北大学、辽宁大学、四川大学、南阳医高专科、郑州大学和郑州航空工业大学等。从以上活跃的研究团队和研究机构可以看出,各研究机构之间合作比较频繁,突破了地缘限制。随着互联网信息技术和社会化媒体的发展,跨地域合作得到了增强,而这种跨地域合作也是科研领域中非常重要的推动力量。活跃的研究团体和机构关键资源在于拥有一批活跃的研究人员,通过对研究者进行分析,有助于了解该领域的主要研究人员及其分布情况。课题组根据普莱斯定律,将计算得出发文3篇及以上的作者定为核心作者,统计得到核心作者共20位,发文量达9篇排名第一的作者为“黄霄羽”。从研究人员发文情况看,虽然年发文量呈现发展上升趋势,但是核心研究人员研究成果并不多,尤其是独立研究成果比较少,只有39篇,占比为8.4%,应与档案社会化媒体这一新兴研究领域的发展阶段有关。另外,464篇文献共分布在109种期刊上,发文量最高的期刊主要属于档案类。109种期刊中核心学术期刊占比为19.23%,所刊载的文献量占比为61.4%。表明档案社会化媒体研究领域受到学界的较大关注,尤其是档案学界对该领域给予了较高的重视。因此,可以推断该研究领域总体发展趋势向好。

2.关键词及其聚类信息的知识图谱关键词能较为准确地反映文献的研究主题,通过对关键词进行分析,能够挖掘出该研究领域的热点问题,并有助于预测未来的研究方向。课题组对464篇文献进行关键词统计,共得到1251个关键词。合并和去除相近或无实际意义的词汇,根据关键词出现的频次,选取词频≥5的关键词集作为分析对象。对这些高频关键词进行两两统计,生成一个关键词共现矩阵,将矩阵导入到Ucinet6.2中,计算节点的点度中心性,并基于点度中心性的大小对关键词进行显示,得到关键词知识图谱图:图谱中节点大小与关键词度数成正比,节点越大表明关键词中心性越大(即关键词词频越高),反之表明关键词中心性越小(即关键词词频越低);图谱中连线的粗细反映的是关键词相互之间关联度的大小,连线越粗表明关键词之间关联度越大(即关键词之间共现频率越高),反之表明关键词之间关联度越小(即关键词之间共现频率越低)。在原始共现矩阵中非零元素的平均值经过计算约为2.97,共现频次设定为2,利用Ucinet6.2将关键词共词矩阵转换成二值矩阵,以便确定核心关键词和边缘关键词。为消除词频差距造成的影响以及相关矩阵中0值对分析结果的干扰,用ochiia系数将共词矩阵转换成相似矩阵,再用1减去相异矩阵中的数据后得到关键词相异矩阵。相异矩阵中的数值反映了关键词两两之间的距离,数值越大表明关键词之间的相似度越小,反之则关键词之间的相似度越大。

三、档案新型资源整合的知识图谱研究

1.档案社会化媒体信息资源的元数据映射标准化建设是档案新型资源有效整合的前提。只有加快档案信息化标准体系建设,才能避免各单位各自为政、盲目建设和“信息孤岛”等现象,保障档案信息资源的有序建设和有效整合。档案信息化建设中的标准制订应该有组织有计划地进行,加强档案界与信息产业界以及特定行业的合作,兼顾与国际标准和通用规范的衔接,注重前瞻性、操作性和导向性,从管理、业务和技术等层面上形成一个科学、配套、适用的标准体系。档案社会化媒体研究尚处于发展上升阶段,基于本课题的研究任务,有必要进一步揭示以档案学为代表的信息管理学科中信息服务关注的知识关联,探索大数据下档案社会化媒体学术资源搜索的可视化应用,最终将档案馆微博、档案信息网、政务网及微信公众号等统一纳入数据采集范围,以实现真正意义上的互联网档案学科相关信息的整合,提供档案知识服务。不同社会化媒体平台的不同网页在结构布局方面存在差异,大体上具备与DC核心元素中的大部分元素相对应的标签项,根据这些标签项能够实现对不同网页元数据信息的结构化抽取。以论坛、博客和微博的网页信息为例,这些标签项与DC元素之间一般遵循如下映射关系:DC元素名称:=<论坛元数据>+<博客元数据>+<微博元数据>+<微信元数据>+……。如,Subject:=[帖子关键词]+[博文标签]+[#话题#];Relation:=[相关分类帖子]+[相关链接]+[@(被提及用户)]。通过上述的知识组织,可以对论坛、博客、微博、微信的元数据元素与DC元数据元素进行映射设计,从而间接实现了各社会化媒体信息资源的元数据之间映射。

2.档案新型资源整合中信息搜索的知识图谱应用拓展档案信息整合辐射面,能够丰富档案资源的内涵。档案新型资源整合的重要目的,是要通过对多载体、多门类档案信息的聚集,形成内涵丰富的档案大资源库,实现档案社会化媒体信息的统筹管理和共享服务。档案新型资源的整合同样是以对档案社会化媒体信息搜索为基础的。档案新型资源搜索的结果排序有以下2个因素:通过属性计算得出搜索词相关度的影响力,通过与其他对象之间关系计算得出搜索对象的影响力。在档案社会化媒体资源搜索中,知识图谱技术可以提供文件关系与知识导引:一是通过文件内容相关性的比较,展示相关文件在不同全宗、案卷、发文机构、所属分类之间的联系;二是通过主题词之间的相关性,展现文件间的关系;三是通过引用与被引用文件间的关系,帮助、引导用户快速获取知识;四是通过直接显示在用户界面与用户输入时智能提示的方法,将用户输入的查询关键词相关、相似的词汇提供给用户。运用知识图谱技术对档案社会化媒体文献进行搜索分析,结果表明:(1)档案社会化媒体领域正处于发展上升阶段,相关理论还需成熟;(2)档案社会化媒体已具备较好的科研资源并受到学界较高的关注,目前已形成多项热点,其中社会化媒体环境下的档案价值研究、社会化媒体环境下的档案信息服务有较强的发展潜力;(3)如何对新型档案信息进行有效整合、集成,形成便于开发、易于共享的服务资源,是档案学界关注和努力解决的重大课题。

3.档案新型资源整合中信息服务的知识图谱应用档案新型资源整合的目的之一,就是能够开展高质量的档案社会化媒体信息服务。基于知识图谱工具选取档案新型资源,以其中的关键词为研究对象构建关键词共现矩阵。可以运用知识图谱直观地反映发文数量、发文比例及组织机构研究的趋势;可以利用词频指数确定高频关键词的限值,利用共词聚类方法获取档案研究知识群;可以基于关键词共现矩阵通过社会网络分析的节点中心性分析,获取档案信息网络中处在核心位置并具控制力的关键词;可以运用知识图谱软件直观、形象地呈现网络内隐含的知识关系,以推进档案新型资源的信息分析和知识服务。当前,档案界的研究对象已经不再是单一的文献信息,而是更多地集中在档案网络资源的发掘上。搜索数据的知识图谱已在产生、收集和传递信息方面大大减少了人力投入并缩短时间,而且在分析和解释上能充当更重要的角色。在档案信息整合中,注重扩展文件收集的范围,凡是反映地方特色、具有典型意义和具有代表性的网上档案信息内容,都应力争纳入档案馆收集范围,作为档案信息资源整合的重要内容。然后,通过开发统一的数字档案管理系统,集中采集新型档案资源信息,以拓展档案信息资源整合的范围和辐射面。下一步,课题组将继续探索大数据下档案社会化媒体资源的知识图谱的具体应用。如根据研究方向数据成像作出正确、有效和有依据的决定,通过档案信息的多元化组织展示,将无序复杂的数据转化为更易用的形式,从而实现档案资源搜索的决策高效和信息准确。总之,促进档案网上社会化媒体信息的交流共享和研究利用,已成为当前深度开发档案新型资源和创新档案信息服务的发展趋势,档案社会化媒体数据的知识图谱应用是我国档案新型资源整合服务发展的必然趋势。

作者:王兰成;黄永勤;余遵成

被举报文档标题:档案社会化媒体现状及信息整合

被举报文档地址:

https://www.meizhang.comhttps://www.meizhang.com/shekezazhi/lzgjsyjzz/723435.html
我确定以上信息无误

举报类型:

非法(文档涉及政治、宗教、色情或其他违反国家法律法规的内容)

侵权

其他

验证码:

点击换图

举报理由:
   (必填)