![点击分享此内容可以赚币 分享](/master/images/share_but.png)
基于科学计量的ChatGPT相关技术研究态势分析.pdf
《基于科学计量的ChatGPT相关技术研究态势分析.pdf》由会员分享,可在线阅读,更多相关《基于科学计量的ChatGPT相关技术研究态势分析.pdf(12页珍藏版)》请在咨信网上搜索。
1、51 收稿日期:2023-05-18项目基金:浙江省“尖兵”“领雁”研发攻关计划项目“多粒度互联网产业链数据协同治理关键技术研究与融合应用示范”(2022C01083)作者简介:卢世晴(1992-),女,馆员,硕士,研究方向:文献计量、产业研究、数字图书馆;施颖佳(1993-),女,馆员,硕士,研究方向:科学计量、文献计量;方红(1976-),通信作者,女,副研究馆员,研究方向:文献计量、产业研究、专利分析;陈登(1978-),通信作者,男,副研究员,研究方向:科技管理、计算机技术。基于科学计量的 ChatGPT 相关技术研究态势分析卢世晴,施颖佳,方 红,陈 登(浙江省科技信息研究院,浙江杭
2、州 310053)摘要:ChatGPT 的横空出世,将新一代人工智能推到了风口浪尖。以 2017 年至 2023 年 2 月 21 日 Scopus 与 Web of Science中 ChatGPT 相关技术科研成果为研究对象,通过科学计量方法,从全球概况、国家表现、领先机构、杰出人才、研究热点等方面对 ChatGPT 相关技术的研究态势开展研究。研究发现:该领域相关研究已步入高速发展阶段,研究成果总体上呈井喷式增长;中国科研体量世界第一,美国仍是最受认可的研究领跑者;中国高校科研产出占绝对优势,美国企业的发文影响力傲视群雄;亚洲地区国际合作发文水平显著低于欧美地区;顶尖学者主要来自美国、中
3、国和英国;研究热点集中于人机交互、算法模型、自然语言处理领域。关键词:ChatGPT;人工智能;科学计量;态势分析;研究前沿中图分类号:TP18;G353.1 文献标志码:A 文章编号:2096-5095(2023)04-0051-12Analysis of the Research Situation of ChatGPT-related Technologies Based on Scientific MetrologyLU Shi-qing,SHI Ying-jia,FANG Hong,CHEN Deng(Institute of Scientific and Technical Inf
4、ormation of Zhejiang Province,Hangzhou 310053,China)Abstract The emergence of ChatGPT has pushed the new generation of AI to the forefront.Taking the research result of ChatGPT-related technologies in Scopus and Web of Science from 2017 to February 21 2023 as the research object the research trend o
5、f ChatGPT-related technologies is analyzed and summarized from the aspects of global overview national performance leading institutions outstanding talents research hotspots etc.through scientific measurement methods.The relevant research in this field has entered a stage of rapid development and th
6、e research results show a blowout growth on the whole China has the largest scientific research volume in the world but the United States is still the most recognized leader Chinese universities have an absolute advantage in scientific research output but the influence of American enterprises publis
7、hing is superior to the others the level of international cooperation in Asia is significantly lower than that in Europe and America top scholars mainly come from the United States China and the United Kingdom the research focuses on human-computer interaction algorithm model and natural language pr
8、ocessing.Key words ChatGPT artificial intelligence sientometrics situation analysis research frontiers2023 年 8 月科技创新发展战略研究Aug 2023第 7 卷第 4 期Strategy for Innovation and Development of Science and TechnologyVol.7 No.4CMYK单页52 0 引言习近平总书记强调,人工智能(AI)是引领当前科技革命与产业变革的战略性技术,具有溢出带动性很强的“头雁”效应1。作为赋能手段,人工智能与实体经济
9、融合,能够引领产业转型,孕育新产业新模式新业态2,为高质量发展注入强劲动力。ChatGPT 作为人工智能公司 OpenAI 的自然语言生成式模型的最新衍生品,一经推出便引发了科技狂潮,被认为是当今最先进的人工智能技术之一,破解了传统人工智能不够智能的难题,极有可能预示一个新时代的启幕。ChatGPT 相关技术涉及大数据、大算力和强算法,并在基础大模型和指令微调的方向探索出新范式。基于其强大的“类人大脑”模式,ChatGPT 相关应用可打破技术边界,运用于各类领域,极有可能成为未来人机交互的一个新入口,甚至成为未来人工智能的基础设施。发展类 ChatGPT 相关技术,可使新一代人工智能成为推动科
10、技跨越发展、产业优化升级、生产力整体跃升的驱动力量3,为社会发展注入全新动能。本文以 Scopus 与 Web of Science(WOS)为数据源,通过科学计量方法,从科研概况、地理分布、机构表现、杰出人才、研究热点等方面深入分析 2017 年至 2023 年 2 月 21 日 ChatGPT相关技术的国内外研究态势,以期为把握领域发展方向、加强战略谋划和系统布局提供参考。1 数据源与研究方法由于 WOS 数据库主要关注于美国、加拿大和英国的出版物,且会议论文的收录范围不够全面4,本文选取收录范围更广泛、更全球化的Scopus 数据库作为数据源,利用 SciVal 科研管理平台开展文献计量
11、研究。SciVal 是基于 Scopus 数据库开发的具有高级分析功能的科研分析平台,汇集来自全球 7 000 多家出版商逾 2.7 万种同行评审期刊所刊登的超过 8 700 万条数据记录5。SciVal 拥有多维度的丰富指标,包括研究体量、研究影响力、领域加权引文影响力(FWCI)、高被引文献、高水平期刊文献、文献专利互引、国际合作及产学合作发文比、研究主题及主题显示度等,已被广泛用于科技评估、科研评价与管理决策6。ChatGPT 是基于转移学习的语言模型,属于生成式对话模型的一部分。与 ChatGPT 最相关的核心模型与技术包括 Transformer 模型、预训练模型、卷积神经网络、循环
12、神经网络、语言模型、生成对齐技术与文本再生成技术,这些技术与模型是ChatGPT 能够生成高质量、连贯、逼真的人类语言的关键因素。基于 ChatGPT 对自身的阐述,结合领域专家意见,对 ChatGPT 相关技术的文献检索、数据采集拟从数据、算法与算力 3 个方面开展,以“generative pre-trained transfomer”“instructgpt”“interactive session”“large language model”“pretrain language model”“autoregressive generative pre-training language
13、 model”“natural language processing”等关键词(包含变体)构建检索策略在Scopus 中进行检索,检索日期限定为 2017 年至2023 年 2 月 21 日,文献学科范围限定为计算机科学、数学与工程学。利用 Scopus 内置分析工具与SciVal 平台,对 4 710 篇文献检索结果展开科学计量分析,从发文体量、研究影响力、卓越产出、学科分布情况、合作情况、国家/地区表现、机构表现、领先人才、研究主题与相关显示度等角度揭示 ChatGPT 相关技术全球研究态势。为更全面地挖掘技术发展趋势与研究热点前沿,以相同检索策略在 WOS 平台上科学引文索引数据库(S
14、CI-E)、国际科技会议录数据库(CPCI-S)、中国科学引文数据库(CSCD)、韩国期刊数据库(KCI-Korean Journal Database)和 SciELO 图书引第 7 卷科技创新发展战略研究第 4 期CMYK双页53 文索引(SciELO Citation Index)中进行检索,检出3 829 篇文献,得到热点论文 1 篇、高被引论文 33篇,对这 34 篇卓越文献进行梳理,剖析当前最具影响力的研究焦点,与 SciVal 分析结果互相验证。2 国内外学术研究分析2.1 全球发展态势概述2017 年至2023 年2 月21 日,ChatGPT 相关核心技术的学术研究成果(以下
15、简称“相关成果”)共计 4 710 篇,以会议论文和期刊论文为主。其中,会议论文 2 805 篇,占总量的 59.6%;期刊论文1 691 篇,占总量的 35.9%。20172020 年,从事相关研究的学者仅 5 366 人,每年发文量不超过700 篇。2021 年,大量研究者涌入,学者人数猛增至 9 620 人,研究者涨幅高达 79.28%,当年发文量也爆涨至 1 194 篇,相关研究进入高速发展阶段。2022 年,该领域热度加深,6 113 位新研究者涌入,相关研究学者膨胀至 15 733 人,年发文量高达 1 745 篇。预计相关研究的热度会持续加深,研究体量会随着时间继续扩大。在科研影
16、响力方面,相关成果的引用量高于整体科研成果的世界平均引用水平,且 2017 年成果的影响尤为深远。2017 年至 2023 年 2 月 21 日,ChatGPT 相关技术的学术研究成果篇均被引频次为13.7 次,高于世界平均水平(7.8 次),总被引量达 63 418 次;在被引量的历年表现中,2017 年因产出了许多革命性的全新研究成果,被引量处于28 946 次的高位,其他年份的被引量相对平稳。在论文质量方面,相关成果的整体质量较好。领域加权的引文影响力(FWCI)是 SciVal 特有指标,是一个归一化的相对指标,它将对象论文的被引用次数与同学科、同出版年、同文献类型论文进行比较,是标准
17、化后的论文影响力,可用于规范化衡量论文质量,国际平均水平为 1。2017 年至2023 年 2 月 21 日,ChatGPT 相关技术学术研究成果的 FWCI 为 2.7,远超全球平均水平。在高水平产出方面,相关成果卓越产出表现亮眼。2017 年至2023 年2 月21 日,ChatGPT 相关技术的学术研究成果中,前 10%高被引文献的优秀论文在整体成果中的占比为 18.7%,高于世界同期平均值(9.8%);前 1%高被引文献在整体成果中的占比为 4.3%,高于世界同期平均值(1%);相关成果发表在前 10%的高影响力期刊的文献在整体成果中占比为 28.1%,高于世界同期平均值(25.1%)
18、;发表在前 1%的高影响力期刊的文献在整体成果中占比为 5.7%,高于世界同期平均值(2.7%)。在经济影响方面,相关成果的基础研究反哺工业研究。科学研究的经济影响可用学术成果的专利引用指标来量化,以表征学术成果被用于创造专利的数量。2017 年至 2023 年 2 月 21 日,12篇 ChatGPT 相关技术的学术研究成果被 99 件专利引用 102 次,在一定程度上存在基础研究向工业研究的反馈流动。在学科领域分布方面,计算机科学是绝对主流。2017 年至2023 年2 月21 日,ChatGPT 相关技术学术研究成果有 90.9%分布在计算机科学领域,有 38.1%涉及工程学领域,有 2
19、3.8%涉及数学领域,并存在与决策科学、物理与天文学、材料科学、社会科学、艺术与人文、药学等领域的多学科交叉融合。在合作情况方面(见图 1),相关成果的对外合作率不高,但对外合作下的科研成果质量极佳。2017 年至 2023 年 2 月 21 日 ChatGPT 相关技术的全部学术研究成果中,有 19.4%为跨区域作者们的合作产出,成果数量虽只有 886 篇,但总被引量达 39 858 次,篇均被引达 45 次,FWCI 达 5.89,成果质量上佳;仅作者所在地区内合作和仅作者2023 年 8 月卢世晴,等:基于科学计量的 ChatGPT 相关技术研究态势分析Aug 2023CMYK单页54
20、所在地机构内合作科研成果发文总量分别为 1 552篇和 1 981 篇,但篇均被引频次分别仅为 7 次和6.2 次,FWCI 仅为 2.51 和 1.67,质量指标远低于国际合作文献的表现;无合作的独立作者科研成果发文量最少,仅占总体成果的 3.8%,篇均被引频次和 FWCI 也最低,分别仅为 3.1 次和 0.7。2.2 国别分析 统计结果显示,2017 年至2023 年2 月21 日有103 个国家/地区开展了 ChatGPT 相关技术研究并有科研成果发表,中国、美国在科研体量上占据绝对优势。为进一步揭示各国在该领域的科研竞争力,将发文或被引总量排行前十的国家/地区科研绩效表现制表(见表
21、1)。在科研体量上,中国占据大头,美国、印度次之。虽然中国的发文总量(未含港澳台地区。下同)在全球遥遥领先,是排行第 2图 1 ChatGPT 相关技术科研成果的合作情况(2017 年至 2023 年 2 月 21 日)注:统计时段为 2017 年至 2023 年 2 月 21 日。下同。表 1 ChatGPT 相关技术发文/被引总量排行前 10 的国家/地区科研绩效国家/地区发文总量/篇科研体量排名/位总被引量/次发文影响力排名/位FWCI国际合作率产学合作率前 10%高被引文献占比前 10%高质量期刊发文占比中国1 865113 29832.122.9%9.7%17.2%33.5%美国77
22、1241 44118.241.6%20.8%33.6%35.3%印度53132 22061.214.1%0.8%15.6%14.6%韩国22642 16371.924.8%4.9%21.2%38.1%英国18552 59553.868.1%11.3%24.9%38.2%德国16961 29592.642.6%12.4%21.9%29.8%日本1447642131.332.6%11.1%18.1%31.0%加拿大121827 588213.547.9%7.4%21.5%48.6%澳大利亚11991 110102.668.9%11.8%29.4%52.5%法国81112 929410.250.6%
23、13.6%25.9%26.8%新加坡71131 34883.276.1%18.3%39.4%62.5%注:统计时段为 2017 年至 2023 年 2 月 21 日。下同。第 7 卷科技创新发展战略研究第 4 期CMYK双页55 位的美国的 2.4 倍,但在如此庞大的科研体量下,其总被引量不足美国的 1/3,美国相关科研成果的篇均被引频次甚至高达中国相关成果篇均被引频次的 7.5 倍。在 FWCI 指标方面,中国的 FWCI为 2.1,与美国的 8.2 存在较大差距。在卓越产出方面,中国在该领域的相关成果中,属于前10%高被引文献的成果只占总体成果的 18.8%,该数值约为美国的 1/2;发表
24、在前 10%高质量期刊上的论文占整体相关成果的 27.9%,与美国的35.3%存在较大差距。美国发文体量较大、发文影响力高、卓越产出表现较好,是该领域的学术研究领跑者;中国发文体量大,但科研产出综合影响力不大,成果质量有待提高;印度虽然发文量位居世界第三,但发文影响力、领域加权影响力与卓越产出表现均不尽人意,科研质量不高。在发文或被引总量排行前十的国家/地区中,加拿大、法国的学术研究呈现“少而精”的特点。加拿大和法国分别以 121 篇和 81 篇的发文量位居世界第 8 位与第 11 位,但其总被引量则分别位居世界第 2 位与第 4 位,受到学界高度重视,尤其是加拿大总被引量高达约 2.76 万
25、次,篇均被引频次更是达到 228 次,科研影响力较大。在领域加权引文影响力(FWCI)中,加拿大和法国同样表现亮眼,分别以 13.5 和 10.2 的指标值排名前列,学术成果质量优秀。此外,ChatGPT 相关技术科研成果的论文对外合作率平均值为 19.4%,上榜国家/地区中仅有印度未达到国际平均水平。就地区来看,亚洲除新加坡外,其他上榜国家/地区的论文对外合作率在 14%33%区间内,亚洲尤其是东亚地区的论文对外合作率相对较低;而欧美科研对外合作整体较为活跃,多在 45%左右,英国更是达到68.1%。就单个国家/地区而言,科研对外合作程度较高的是新加坡、澳大利亚和英国,均达到65%以上。上述
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 科学 计量 ChatGPT 相关 技术研究 态势 分析
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。