我国信息资源管理学科及其邻近学科视角下的新兴主题识别.pdf
《我国信息资源管理学科及其邻近学科视角下的新兴主题识别.pdf》由会员分享,可在线阅读,更多相关《我国信息资源管理学科及其邻近学科视角下的新兴主题识别.pdf(11页珍藏版)》请在咨信网上搜索。
1、理论研究我国信息资源管理学科及其邻近学科视角下的新兴主题识别*钱旦敏,楼筱湾,王华麟,王文敬,马野青*本文系教育部人文社会科学研究基金项目“新市民公共卫生信息精准化服务模式研究”(项目编号:17YJCZH140)研究成果。摘要文章通过对我国信息资源管理学科及其邻近学科新兴主题的识别研究,为我国信息资源管理学科领域学者提供研究方向,并为信息资源管理学科与邻近学科开展合作研究提供思路,助力信息资源管理学科守正创新、挖掘学科内在发展机制、支撑科技战略决策和前瞻学科应用价值。首先以CJFD中“图书情报与数字图书馆”类文献作为信息资源管理学科研究对象,将与该学科同属于一级类目“信息科技”下的其他9个二级
2、类目作为信息资源管理邻近学科纳入研究对象;检索CJFD中这10个学科自2012年至今的高影响力文献,并提取关键词。然后选用AP算法对关键词进行主题聚类,利用灰预测模型自建新兴主题探测指标,识别信息资源管理学科新兴主题;自建主题友好度指标,识别信息资源管理邻近学科友好型新兴主题。最终模型识别并验证得出5个信息资源管理学科新兴主题:在线健康社区、信息资源管理学科建设、公共文化服务、学术影响力、数字记忆;在此基础上得到邻近学科中与信息资源管理学科有高友好度的5个邻近学科友好型新兴主题:机器学习、数字治理、融媒体、学术期刊与新媒体、数智赋能。关键词信息资源管理新兴主题识别AP算法灰预测模型引用本文格式
3、钱旦敏,楼筱湾,王华麟,等.我国信息资源管理学科及其邻近学科视角下的新兴主题识别J.图书馆论坛,2023,43(9):54-64.Identification of the Emerging Themes from the Perspective of InformationResource Management and Its Adjacent Disciplines in ChinaQIAN Danmin,LOU Xiaowan,WANG Hualin,WANG Wenjing&MA YeqingAbstractBy identifying the emerging topics of C
4、hinese Information Resource Management discipline and itsneighbouring disciplines,this paper provides research directions for Chinese scholars in the field of InformationResource Management(IRM),and offers ideas for the collaborative research between IRM discipline and itsadjacent disciplines,helpin
5、g IRM discipline to innovate on the basis of tradition,explore the internaldevelopment mechanism,support the strategic decision-making in science and technology and foresee itsapplication value.This article takes the literature of“Library,Information and Digital Library”,whichrepresents the IRM disc
6、ipline,in CJFD as the object of study,together with that of the other 9 secondarycategories under the same primary category of Information Technology,which represents the neighbouringdisciplines.It retrieves the high-impact articles of the ten disciplines in CJFD since 2012 and extracts theirkeyword
7、s.It uses the AP algorithm to cluster the keywords and creates a detection index for the identification ofemerging topics in the discipline of Information Resource Management,based on the grey prediction model.Forother adjacent disciplines,a theme-friendly index is developed to identify the friendly
8、 emerging topics.This studyidentifies and validates 5 emerging themes in the Information Resource Management discipline,namely onlinehealth community,development of IRM discipline,public cultural service,academic influence and digital542023年第9期理论研究0引言当前信息技术是重塑世界竞争格局的重要力量1,相关学科建设日益重要。2021年12月10日,国务院学
9、位委员会办公室发布的关于对博士、硕士学位授予和人才培养学科专业目录及其管理办法征求意见的函将“图书情报与档案管理”(以下简称“图情档”)一级学科更名为“信息资源管理”。信息资源管理学科展现出了广阔的发展前景。敏锐抓取信息资源管理学科新兴主题,能够为信息资源管理领域学者提供研究方向,进而推动信息资源管理学科创新发展。中国制造2025强调把握未来科技趋势并寻求学科交叉融合的重要意义2,以有效解决单一学科很难甚至无法解决的复杂问题。因此,探索友好邻近学科影响下的信息资源管理学科新兴主题,可以为信息资源管理学科与邻近学科的协作研究提供新的思路。基于上述考虑,笔者提出构建一种基于邻近学科友好度的信息资源
10、管理学科新兴主题识别模型。笔者选用AP算法,利用灰色预测模型构建新兴主题探测指标TD-TA(ThemeDetection&Theme Age),以及邻近学科主题友好度指标SFr(Subject Friendliness),进行信息资源管理学科新兴主题及其友好型主题识别,以期为信息资源管理学科与邻近学科开展合作研究提供创新思路,为信息资源管理领域发展注入新的活力,以达到学科融合、相得益彰的效果。同时也为认知学科内在发展机制、支撑我国科技战略决策、预见学科未来应用价值提供方向。1文献综述关于信息资源管理学科主题研究,宋艳辉等从数量、时间、导师维度揭示1994-2018年间信息资源管理学科博士学位论
11、文中不同研究主题的发展趋势及演变过程3。闫慧等4比较国内外信息资源管理学科的研究热点主题,探索学术热点主题与学科发展的关系。陈仕吉等5从大数据研究的整体视角分析图情领域大数据的研究主题,进一步讨论研究发展趋势。Kim等6对信息资源管理学科学术论文的标题和摘要进行动态主题建模,以分析研究主题趋势。Han等7利用潜在Dirichlet分配模型进行信息资源管理学科潜在主题识别。Ma等8对图书情报学研究主题与方法的演变与变迁进行了研究。综上,现阶段信息资源管理学科的主题研究聚焦于热点主题及其发展趋势,对新兴主题的研究相对罕见。关于新兴主题研究方法,杨金庆等9认为基于科技文献元数据的新兴主题识别多从计量
12、学理论出发量化新兴主题特征属性。白敬毅等10提出基于主题模型和曲线拟合的新兴主题趋势预测方法。陈稳等11建立融合计量指标多变量的LSTM模型以实现新兴主题热度的预测。Huang等12将链接预测模型与机器学习技术相结合,提出基于动态共词网络分析的新兴主题识别框架。Bisma等13提出基于复杂网络分析的方法来分析最新文献,进而探测通信网络领域潜在的主题和新出现的趋势。Shen等14提出分解、开源、灵活的自然语言处理和文本挖掘方法,用于新兴主题检测。Cai等15采用ML主题探测方法分析金融领域新兴主题。当前学者多采用大数据模型进行研究,但新兴主题研究存在早期信息不足、关键词变化趋势分布极不均衡、大样
13、本模型表现较差等现象,因此用大数据模型研究会导致大部分识别方法的效果与预期存在差距16。关于信息资源管理学科新兴主题研究,李长玲等17构建信息资源管理学科作者潜在跨学科合作度指数模型,运用VBA语句抽取信息资源管理与计算机学科的交叉研究主题,计算各主题的两学科作者间潜在跨学科合作度,并识别潜在跨学科合作组合。Dong等18集成共现网络分析、高memory.On this basis,it obtains five friendly emerging topics in the neighbouring disciplines that are highlyfriendly to the IRM
14、 discipline:machine learning,digital governance,convergence media,academic journalsand new media,digital intelligence empowerment.Keywordsinformationresourcesmanagement;emergingthemeidentification;APalgorithm;greypredictionmodel55理论研究TI术语分析和突发检测多种方法,提出一种从科学文献中识别和预测跨学科主题的集成方法,为信息资源管理跨学科主题识别提供了一个整体视角。
15、Xu等19提出主题术语跨学科性(TI)指标,利用TI值和Bet值、术语频率值等确定信息资源管理跨学科主题,并基于社会网络和时间序列分析跨学科科学的演变。可见,信息资源管理学科主题识别研究成果中,已有学者进行跨学科视域的主题识别研究,但尚未发现信息资源管理新兴主题识别研究。另外,在跨学科研究中,数据分析仅局限在信息资源管理与所跨某一学科中,且无学科间友好度测量指标,跨学科领域亦有待扩展。纵观已有研究发现:(1)相比信息资源管理学科热点主题研究,新兴主题有较大研究空间。(2)新兴主题研究存在前期数据不足等特征,灰预测作为对含有不确定因素的系统进行小样本预测的方法,正好弥补其研究样本不足的难点,但尚
16、未发现有学者用灰预测进行信息资源管理学科新兴主题研究20。(3)在少数已有的跨学科主题识别研究中,数据分析范围和学科间友好度测量有待进一步扩展。综上,笔者基于灰预测构建新兴主题探测指标TD-TA,将一级类目下其他多个二级学科作为邻近学科数据来源,并自建邻近学科主题友好度指标SFr,量化信息资源管理学科与邻近学科合作发展关系度。2研究思路与方法2.1研究思路为有效识别信息资源管理学科新兴主题,笔者提出一种基于GM(1,1)的信息资源管理学科新兴主题识别模型。以中国知网的中国期刊全文数据库(CJFD)中信息资源管理学科及其邻近学科的高影响力文献作为数据源。首先,根据笔者构建的新兴主题探测指标,识别
17、本学科新兴主题(Emerging Theme,简称ETn)。然后,考虑信息资源管理学科与信息资源管理邻近学科之间的联系与影响,识别信息资源管理邻近学科友好型新兴主题ET*m,以期通过识别出信息资源管理学科在受到邻近学科影响下的新兴主题,为本领域学者提供研究方向,并为信息资源管理学科与邻近学科开展合作研究提供思路。新兴主题识别方法框架如图1所示,包括3个阶段:AP算法获取研究主题、新兴主题探测指标识别信息资源管理学科新兴主题、构建友好度指标识别邻近学科友好型新兴主题。2.2ETn和ET*m聚类算法采用AP算法21对信息资源管理及其邻近学科的关键词进行聚类分析。构建关键词共现矩阵见式(1),其中N
18、ij表示关键词i和关键词j同时出现的次数,当i=j时表示关键词i出现的次数,可简写为Ni;利用Jaccard系数见式(2),将共现矩阵转换为相关矩阵22见式(3),其中Jij表示关键词i和j的相似度,Jij越大,关键词i和j的相似度越高。N1N12 N1nN21N2 N2n Nn1Nn2 Nn(1)Jij=Nij(Ni+Nj-Nij)(2)1 J12 J1nJ211 J2n Jn1Jn2 1(3)AP 算法一般以相似度矩阵 S 作为输入信息,并将其对角线元素赋为同一值P,称为偏图1信息资源管理学科新兴主题识别方法框架图信息资源管理邻近学科友好型新兴主题ET*m主题友好度SFr交集关键词邻近学科
19、关键词主题年龄TA主题发展度TD增长性指标&发展潜力指标新颖性指标信息资源管理学科新兴主题ETn聚类结果AP算法关键词第一阶段:获取研究主题第二阶段:识别信息资源管理学科新兴主题第三阶段:寻找信息资源管理学科与邻近学科友好的新兴主题562023年第9期理论研究向参数,P值大小决定每个样本最初被选作簇代表点的可能性,与簇的数量成正相关,因此可通过调整P值设定簇的数量23。算法通过迭代更新吸引度r(i,k)和归属度a(i,k)实现聚类,采用Jaccard相似系数的AP算法流程见下22。定义相似度矩阵元素S(i,k),如式(4),令a(i,k)=0:S(i,k)=Jik,ikp,i=k(4)依据式(
20、5)和式(6)对 r(i,k)和 a(i,k)进行更新:r(i,k)S(i,k)-maxks.t.kka(i,k)+s(i,k)(5)a(i,k)=min0,r(k,k)+is.t.ii,kmax0,r(i,k),ikis.t.ikmax0,r(i,k),i=k(6)引入阻尼系数,由式(7)消除可能出现的震荡:rnew(i,k)=rold(i,k)+(1-)r(i,k)anew(i,k)=aold(i,k)+(1-)a(i,k)(7)其中,(01)越大,其对震荡的消除效果越佳,一般将其设为0.923。通过式(8)确定每一个样本i的簇代表点ci:ciarg max1kna(i,k)+i(i,k)
21、(8)当迭代更新10次后,所有样本的簇代表点仍保持不变或达到预先设置的最大迭代次数时算法结束,否则转到步骤继续执行。2.3信息资源管理学科新兴主题ETn识别2.3.1主题趋势预测模型GM(1,1)灰色系统理论是一种解决信息不完备系统的数学方法,可用于分析小样本、不完全信息的系统问题24。灰色预测GM(1,1)模型的建模过程,首先是将无规律的原始数据进行累加,得到规律性较强的生成数列;然后进行建模,由模型得到数据再进行累减得到原始数据的预测值;最后,进行预测25。由于GM(1,1)能满足新兴主题具有的灰色性、不确定性和可收集关键词样本数量不足等特点,故运用GM(1,1)对信息资源管理学科未来新兴
22、主题进行识别。为保证建模方法的可行性,对数据进行级比检验,见下。(k)=x0(k-1)x0(k)(9)若 所 有 级 比 均 落 在 可 容 覆 盖 区 间 x=(e-2n+1,e-2n+2)内,则满足条件,建立模型。GM(1,1)模型构建流程25见下。设原始数据集:x(0)=(x(0)(1),x(0)(2),x(0)(3),x(0)(4),x(0)(n)(10)计算一次累加生成序列:x(1)=(x(1)(1),x(1)(2),x(1)(3),x(1)(4),x(1)(n)(11)其中,x(1)(k)=i=1kx(0)(i)(12)计算x(1)的均值生成序列:z(1)=(z(1)(2),z(1
23、)(3),z(1)(4),z(1)(n)(13)其中,z(1)(k)=0.5x(1)(k)+x(1)(k-1),k=2,3,4,n(14)建立灰微分方程:x(0)(k)+az(1)(k)=b,k=2,3,4,n(15)建立对应的白化微分方程:dx(1)dt+ax(1)(t)=b(16)根据步骤给出的方程组,通过最小二乘法求出a、b的最优解:u=a,bT,Y=x(0)(2),x(0)(3),x(0)(n)T,B=-z(1)(2)1-z(1)(3)1-z(1)(n)1(17)u=a,bT=(BTB)-1BTY(18)求解方程得到预测值:x(1)(k+1)=xx(0)(1)-bae-ak+ba,k=
24、1,2,n-1(19)累减还原得到原始数据序列:x(0)(k+1)=x(1)(k+1)-x(1)(k),k=1,2,n-1(20)进行残差检验:(k)=x(0)(k)-x(0)(k)(21)这里x(0)(1)=x(0)(1),(k)代表平均绝对残差,值越小说明拟合效果越好。2.3.2信息资源管理学科新兴主题探测指标TD-TA2002 年 Matsumura 等26提出新兴主题一词,指出其是一组代表领域未来发展趋势的词或词组簇。随后学者对于新兴主题的内涵进行了探57理论研究索。Tu等27认为其是处于生命周期早期阶段的研究主题,是热门主题的前身,代表着领域发展趋势。Rotolo等28强调新兴主题具
25、备新颖性、快速增长性、连贯性、显著影响力、不确定性及模糊性。白敬毅等10认为其是具有新颖性、先进性、发展潜力的研究主题,具备极高创新性、较强连贯性、较快增长性、对科技领域有较强影响力等特征。陈稳等11认为其是具备新颖性、成长性和持续性的研究主题,处于主题生命周期的早期阶段,可能尚未得到大量关注,但具有良好的发展潜力。基于已有对“新兴主题”的内涵界定,笔者将信息资源管理学科新兴主题界定为在近年刚出现、讨论热度呈增长趋势、处于主题演化路径早期且能够反映学科未来发展的主题,总结新兴主题具备新颖性、增长性和发展潜力三大特征。笔者构建主题发展度TD,并结合主题年龄TA,构建新兴主题探测指标(TD-TA指
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 我国 信息资源 管理 学科 及其 邻近 视角 新兴 主题 识别
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。