分销赏收藏举报申诉 / 8

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > AI生成与学者撰写中文论文摘要的检测与差异性比较研究.pdf

AI生成与学者撰写中文论文摘要的检测与差异性比较研究.pdf

上传人：自信****多点

文档编号：523859

上传时间：2023-11-06

格式：PDF

页数：8

大小：2.07MB

《AI生成与学者撰写中文论文摘要的检测与差异性比较研究.pdf》由会员分享，可在线阅读，更多相关《AI生成与学者撰写中文论文摘要的检测与差异性比较研究.pdf（8页珍藏版）》请在咨信网上搜索。

1、收稿日期:2023-05-19摇摇摇摇摇摇修回日期:2023-06-06基金项目:国家社会科学基金重点项目“开放科学数据集统一发现的关键问题与平台构建研究冶(编号:20ATQ007)的研究成果。作者简介:王一博,男,1992 年生,博士研究生,馆员,研究方向:数据分析、用户研究、科学评价;郭摇鑫,男,1992 年生,博士研究生,研究方向:数据挖掘、科学评价;刘智锋,男,1995 年生,博士研究生,研究方向:学术文本挖掘、科学计量与科学学、计算社会科学;王继民,男,1966 年生,教授,博士生导师,研究方向:机器学习、Web 数据挖掘、科学评价、信息可视化等。通信作者:郭摇鑫信息

2、管理AI 生成与学者撰写中文论文摘要的检测与差异性比较研究*王一博1,2摇郭摇鑫1摇刘智锋1摇王继民1(1.北京大学信息管理系摇北京摇 100871;2.北京大学图书馆摇北京摇 100871)摘摇要:研究目的该研究从实证角度对 AI 生成与学者撰写的中文论文摘要的检测方法进行研究,并分析其文本内容特征差异,可为 AI 生成文本的自动检测及相关研究提供参考。研究方法首先,以图书馆学领域 100 篇高被引论文为例,基于论文题目应用 GPT-4 大模型生成相应的摘要,构建分析数据集;其次,采用有监督的机器学习和深度预训练模型对 GPT-4 生成和学者撰写的摘要进行分类检测,同时采用查

3、重软件对内容的重复率进行检测;最后,分别从摘要长度、句子数量、词汇特征、常用搭配等维度,揭示 AI 生成与学者撰写中文论文摘要之间的异同点。研究结论基于训练语料所搭建的分类器可有效识别中文论文摘要是否由 AI 生成,其中,逻辑回归(Logistic)、集成学习模型(RF、LightGBM)和 BERT 模型的 F1-Score 均超过 90%。AI 生成的摘要呈现出较高的同质性,具有较强的写作逻辑性,并惯用归纳总结等学术话语体系;而学者撰写的摘要则具有显著的个性化差异,使用凸显实际含义的搭配较多,并常用与国家政策密切相关的词语。关键词:图书馆学;AIGC;GPT-4;论文摘要;摘要检测;文本

4、分类中图分类号:G353摇摇摇摇摇摇摇摇摇文献标识码:A摇摇摇摇摇摇摇文章编号:1002-1965(2023)09-0127-08引用格式:王一博,郭摇鑫,刘智锋,等.AI 生成与学者撰写中文论文摘要的检测与差异性比较研究J.情报杂志,2023,42(9):127-134.DOI:10.3969/j.issn.1002-1965.2023.09.018Detection and Comparative Study of Differences Between AI-Generated andScholar-Written Chinese AbstractsWa

5、ng Yibo1,2摇 Guo Xin1摇 Liu Zhifeng1摇 Wang Jimin1(1.Department of Information Management,Peking University,Beijing摇 100871;2.Peking University Library,Beijing摇 100871)Abstract:Research purposeThis study investigates the detection methods of AI-generated and scholar-written Chinese paper abstractsfrom

6、an empirical perspective,and analyzes the differences of text content features,providing a reference for the automatic detection of AI-generated text and related research.Research method First,using 100 highly cited papers in the field of library science as an exam鄄ple,we generate corresponding abst

7、racts based on the paper titles using the GPT-4 large model,and construct an analysis dataset.Next,we employ supervised machine learning and deep pre-trained models to classify and detect GPT-4-generated and scholar-written ab鄄stracts,and use plagiarism detection software to examine content duplicat

8、ion rates.Finally,we reveal the similarities and differences be鄄tween AI-generated and scholar-written Chinese paper abstracts in terms of abstract length,sentence count,lexical features,and commoncollocations.Research conclusion The classifier built based on the training corpus can effectively iden

9、tify whether the Chinese paperabstract is generated by AI,among which,the F1-Score of logistic regression(Logistic),ensemble learning models(RF,LightGBM)第 42 卷摇第 9 期2023 年 9 月摇摇摇摇摇摇摇摇摇摇摇摇摇情摇报摇杂摇志JOURNAL OF INTELLIGENCE摇摇摇摇摇摇摇摇摇摇摇摇摇Vol.42摇 No.9Sep.摇 2023and BERT model are

10、all over 90%.AI-generated summaries present a high degree of homogeneity,have strong writing logic,and habitu鄄ally use academic discourse systems such as induction and summary;while the abstract written by scholars has significant individual differ鄄ences,uses more word combinations that highlight th

11、e actual meaning,and often uses words closely related to national policies.Key words:library science;AIGC;GPT-4;paper abstract;abstract detect;text classification0摇引摇言2022 年底,ChatGPT 的问世受到学术界和工业界的广泛关注。其诞生使得人工智能生成内容(Artifi鄄cial Intelligence Generated Content,AIGC)成为新的研究热点。AIGC 不仅指代人工智能生成的内容及相关的技术,也

12、可指代其具有特定的“生成冶行为,广泛应用于营销、娱乐、创作等场景1。AIGC 的相关研究可追溯到20 世纪90 年代,当时尚处于试验阶段,进入21世纪后,微软等科技巨头开始训练机器生成内容。2007 年,人工智能创作的小说1 The Road问世;2012年微软发布全自动同声传译系统;2014 年 Lan J.Goodfellow 提出生成式对抗网络(GAN)可用于文本的生成2;2019 年 DVD-GAN 模型可用于生成连续性视频3;2022 年 David Holz 工作室开发的 Midjourney只需 1 分钟便可根据人类输入的自然语言生成图片;同年 8 月,AI 生成的画作获得数字艺

13、术类冠军4。目前,AIGC 的应用已经出现在影视、电商、金融、医疗、教育、咨询等垂直行业中。作为生成式人工智能的代表,ChatGPT 具备理解人类语言、解答自然科学问题、应对真实法律案件、辅助医生进行诊断等能力。在学术领域,已有诸多学者将发表的学术论文加入 ChatGPT 作为合著者5-7,来自 S 开展的 1000 名 18 岁以上的学生关于ChatGPT 在课堂上使用情况的调查表明:89%的美国大学生利用 ChatGPT 写作业8。这些案例都说明ChatGPT 在学术领域具有强大的创作能力。2023 年 3月,GPT-4 正式发布,该产品可以处理包含图像、声音等多模态信息,并在各种专业和学

14、术基准测试中表现出近似人类水平的能力9。在此背景下,检测学术论文内容是否由 AI 生成以及生成文本内容的特征已成为一个值得研究的问题。本研究可为 AI 生成文本的质量评估和优化提供参考,促进 AI 技术在学术领域的合理应用和发展,防范 AI生成学术内容的滥用;同时,所揭示的 AI 生成与人类撰写中文论文摘要的特征,可为人机协同写作提供新的研究视角。1摇相关研究部分国外学者对 ChatGPT 类工具生成的内容与学者撰写的内容进行了分析和对比研究。Kutela B 等以交通安全领域已经发表的 327 篇论文的引言作为数据源,使用有监督的分类算法和无监督的文本网络分析方法,比较 ChatGPT 生

15、成的引言与学者撰写引言的差异性10。该团队还在另一项研究中比较了不同类型的提示语(Prompt)生成引言的文本相似度差异,并使用文本网络分析对不同提示语生成的内容进行比较11。Gao C A 等使用人工智能输出检测器、抄袭检测器和盲审人员比较 ChatGPT 生成的摘要与专家撰写摘要的质量和可信度,发现 ChatGPT 生成的摘要虽然表面上文字通顺,但是不符合期刊的格式要求,数据也是杜撰的12。Taecharungroj V 收集了2022 年11 月30 日至 12 月 31 日讨论 ChatGPT 主题的 Twitter 文本共计 23 万余条,使用 LDA 建模分析,揭示了 3 个一般主

16、题和 5 个功能区域,分析了该类技术对人类可能带来的积极和消极影响13。Biswas S 介绍了 ChatGPT在计算机编程方面的能力,包括代码补全、纠错、预测、Bug 修复、文档生成、代码优化等,并说明了 ChatGPT可以帮助用户理解复杂概念和技术,诊断与发现问题,提供资源列表等14。目前,国内学者对 ChatGPT 等 AIGC 工具开展实证类研究的论文较少,而以理论研究居多。可以概括为如下两个方面:一方面是探讨 AIGC 工具对学科发展造成的影响。如陆伟阐述了大模型对信息资源管理学科研究与实践带来的影响15;曹树金等认为生成式 AI 将从研究问题、数据源和研究范式影响情报学的发展16;

17、张智雄等分析了 ChatGPT 的特点以及对文献情报工作的启示17;此外,尹克寒论述了 ChatGPT 在情报信息机构的功能定位、丰富服务形态等方面影响18。另一方面是对 AIGC 的概念、发展历程、技术特征和发展阶段的归纳总结19;或是分析 ChatGPT 等AIGC 工具为科研工作者20、学术研究成果及人才评价21、智能信息处理22等带来的机遇与挑战;以及对图书馆、文献资源采购和组织、馆员技能等方面的影响23-25;也有对 ChatGPT 的技术架构26、中文评测27、用户意愿28等方面的讨论。整体而言,对 ChatGPT 类工具生成内容开展的实证分析以国外学者研究居多,国

18、内学者更加关注该类工具给学科发展及各行业带来的机遇和挑战等,针对中文语料的实证研究相对较少。因此,本研究将重点关注 AIGC 工具生成的中文摘要与学者在期刊论文上821 摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇情摇报摇杂摇志摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇第 42 卷撰写的摘要之间的异同,进一步推动 AIGC 工具在中文环境下的研究和应用。2摇数据与方法为了比较 AI 生成与学者撰写的中文学术论文摘要的差异,本研究需要构建两类论文摘要作为研究语料。学者撰写的论文摘要来源于已发表的学术论文,获取相对容易;

19、而 AI 生成的论文摘要则需要基于给定的提示语和论文标题进行生成。GPT-4 作为基于 Transformer 架构和自监督预训练的语言模型,是截止目前 OpenAI 发布的最先进、最强大的语言模型9,据此本研究选择 GPT-4 作为中文学术论文摘要生成的模型。经过反复对比实验,最终确定以下提示语作为 GPT-4 摘要生成的输入:“假如您是一位图书馆学领域的知名学者,我请您协助我撰写一篇中文学术论文的摘要,我将提供一个中文学术论文题目,希望您根据这些题目为我撰写相应的论文摘要。第一个论文题目是:XXX。冶本研究所设计的研究框架如图 1 所示,首先构建AI 生成论文数据集和学者撰写论文数据集,并

20、对数据进行预处理;在此基础上,分别构建支持向量机(SVM)、逻辑回归(Logistic)、随机森林(RF)、轻量级梯度提升机(LightGBM)、朴素贝叶斯(NB)等机器学习和 BERT 深度预训练模型进行分类检测,同时采用维普论文检测系统工具进行查重,以对比分析两者之间的重复率;最后,分别从摘要长度、句子数量、词汇特征、常用搭配等维度对文本进行对比分析和可视化。图 1摇研究框架摇 2.1摇数据源和数据预处理本文以图书馆学领域为例,从专业核心期刊中(同时被 CSSCI 收录和北大核心收录)选择 5 种不同的期刊包括中国图书馆学报大学图书馆学报图书馆论坛国家图书馆学刊和图书馆学

21、研究,它们均是图书馆学领域影响因子较高的期刊,可在一定程度上代表该学科高质量论文的研究。接着,本研究分别从每本期刊中筛选 20212022 年间 20 篇按照知网被引频次降序排列的论文共计 100 篇作为研究样本,具体论文数据如表 1 所示。表 1摇图书馆学五种核心期刊论文数量与平均被引频次分布期刊名称论文数量平均被引频次中国图书馆学报2031.75大学图书馆学报2019.95图书馆论坛2033.05国家图书馆学刊2017.35图书馆学研究2017.80摇摇获取到给定提示语和论文标题后,使用 GPT-4 生成所需摘要并将其保存至本地文件,同时将学者撰写的摘要也下载保存至本地文件。如下为数

22、据预处理的主要步骤:第 1 步,领域词表的构建:下载近三年图情领域约5000 篇中文期刊论文的题录信息,将论文的关键词作为初始词表,经过高频词统计、数据去重及人工筛查后,最终选取词频较高的 2172 个论文关键词作为领域词表,为后续中文分词做准备。第 2 步,停用词表的选择:为准确反映 GPT-4 与学者写作风格,本研究仅将常用标点符号和少量无实际意义的单个字纳入到停用词表。第 3 步,中文分词与词性标注:在 jieba 分词中加载领域词表和停用词词表,使用精准模式进行中文分词并标注词性。第 4 步,类别标记:将 GPT-4 生成与学者撰写的摘要合并到一个数据集中,并分别用类标号 1 和 0

23、标记这两种不同的摘要生成方式。摇 2.2摇分类检测模型的选择本研究的目标是分析 GPT-4 生成和学者撰写论文的摘要之间的差异,探究是否可以通过机器学习或深度学习模型进行自动检测。本研究将检测问题转化为二分类问题,选择 TF-IDF(Term-Frequency-InverseDocument Frequency,词频-逆文档频率)作为文本向量化方法,采用 SVM、NB、Logistic、RF、LightGBM 等常用的机器学习分类算法和深度预训练模型 BERT 进行实验。为了评估分类器的性能,选择准确率、精确率、召回率、F1-Score 作为评估指标,并将数据集的921摇第 9 期摇摇

24、摇摇摇摇摇摇摇王一博,等:AI 生成与学者撰写中文论文摘要的检测与差异性比较研究70%作为训练集,用于训练模型,剩余的 30%作为测试集,用于评估模型的性能。摇 2.3摇文本分析方法本研究采用高频词统计法、N-gram、共词分析法等文本分析与挖掘方法,以揭示 GPT-4 生成与学者实际撰写摘要之间的差异。高频词统计法是一种直观有效的方法,文本中出现次数较多的词汇,通常能够反映出该文本主题的核心内容和特点。本研究在完成文本数据预处理后,将GPT-4 生成和学者撰写摘要的词汇数量和词性分别进行统计,并按照出现频率进行排序。N-gram 是指一个语料库或文本中连续出现的 n个词的序

25、列,由 Shannon 最早将马尔科夫链应用于英文文本,并发现 N-gram 模型可以产生自然语言序列,可通过给定序列的概率预测下一个序列的概率29。本研究基于 N-gram 分析了 GPT-4 生成和学者撰写摘要中常用搭配的差异性。共词分析法是一种文本内容分析方法,在一个文本句中,若一对词语共同出现次数越多,表明它们的关系越密切、距离越近30。通过绘制 GPT-4 生成和学者撰写摘要的关键词共现网络,可以更准确地揭示两者写作用词的异同。3摇结果与分析摇 3.1摇分类检测结果在对 GPT-4 生成与学者撰写的中文学术论文摘要分类效果进行测试时,我们选择了前文所述的 6 种不同的分类器,分类

26、结果如表 2 所示。表 2摇不同分类器在 GPT-4 生成与学者撰写摘要的分类效果分类器评价指标AccuracyPrecisionF1-ScoreSVM73.33%70.97%73.33%NB56.67%52.73%69.05%Logistic93.33%90.32%93.33%LightGBM95.00%93.33%94.92%RF96.67%96.55%96.55%BERT98.33%96.67%98.31%摇摇由表 2 可知,在 6 个分类器中,BERT 具有最佳的分类效果,其 F1-Score 达到了 98.31%(表 2 粗体显示),Accuracy、Precision 指标都

27、超过了 96%,这说明它能很好地区分摘要是由学者撰写还是由 GPT-4 生成。此外,Logistic、RF 以及 LightGBM 的 Accuracy、Preci鄄sion、F1-Score 三个指标均超过了 90%,表明在大多数情况下,它们也能有效地识别出摘要是否由学者撰写。然而,SVM 与 NB 表现相对较差,F1-Score 仅达到70%左右的水平。分类器的特征重要性是指分类器的各个不同特征对于模型分类和检测能力的贡献度,特征排名越靠前,表明该特征对于分类模型的贡献度越高。我们选取F1-Score 超过 90%的三个机器学习分类器Logistic、RF 和 LightGBM,分析它们的

28、前 20 个最重要特征词,结果如表 3 所示。表 3摇 RF、Logistic 和 LightGBM 前 20 个重要特征词序号RF 特征词Logistic 特征词LightGBM 特征词1本文本文本文2最后最后提出3探讨首先最后4首先探讨发展5建议旨在首先6接着通过探讨7提供建议通过8提出提出旨在9其次学生提供10包括提供研究11针对随着进行12随着为例包括13挑战参考文献应用14通过分析分析15旨在挑战建议16以期提高接着17一系列参考构建18面临此外挑战19分析培养智慧20参考基础方面摇摇尽管三个分类器的重要特征词排名有一定差异,但有 11 个特征词(占比 55%,表 3 粗体显示)

29、同时被三个分类器认为是最重要的特征词,包括“本文冶“首先冶“最后冶“提出冶“探讨冶等,意味着 AI 工具和学者在撰写内容时对这些词汇具有不同的使用风格,使得分类模型能够在一定程度上通过这些词的使用情况区分文本内容是否由学者撰写。此外,我们使用维普论文检测系统对论文摘要的原创性进行检测,将学者撰写和 GPT-4 生成的各自100 篇摘要分别合并成待检测的文本文件,将这两个文件提交到维普检测系统进行检测,发现学者撰写和GPT-4 生成内容的重复率分别为96.82%和18.64%。这表明绝大多数论文都被维普数据库收录,且能被较为准确地识别出。然而,GPT-4 生成的摘要重复率仅为 18.64%,当论

30、文检测的重复率阈值设定为 20%时,AI 生成的内容可以通过查重工具的重复率检测。摇 3.2摇文本分析结果3.2.1摇摘要长度与句子数量分析本小节对摘要长度和句子数量进行分析,以揭示GPT-4 生成和学者撰写的摘要写作特征的差异。其031 摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇情摇报摇杂摇志摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇第 42 卷中,摘要长度是指一篇完整摘要的中文字符个数(不包含空格)。分别对两者的摘要长度进行统计,并绘制正态分布拟合直方图(见图 2)。统计结果显示,GPT-4 生成的摘要长度平

31、均值和均方差值分别为279.44 个中文字符和 48.98 个中文字符,而学者撰写的摘要长度平均值和均方差值分别为 269.23 个中文字符和 96.76 个中文字符;两者的平均值接近,但 GPT-4 生成的摘要长度差异性较小,分布更为集中。7000 010.0 008.0 006.0 004.0 002.0 000.100200300400500600700valueProbability DensityGPT-4_Histogram with Normal Distribution Fit300400500600valueScholar_Histogram with Normal Dist

32、ribution Fit1002000 007.0 005.0 004.0 002.0 001.0 000.Probability Density0 003.0 006.图 2摇 GPT-4(左)生成与学者(右)撰写摘要长度正态分布拟合直方图图 3摇 GPT-4(左)生成与学者(右)撰写摘要长度的箱线图进一步,通过绘制 GPT-4 生成和学者撰写摘要长度的箱线图(见图 3),发现 GPT-4 生成的摘要长度最大为 420 个中文字符,最小为 167 个中文字符,极差为253 个中文字符;而学者撰写摘要字数最大为 670 个中文字符,最小为 87 个中文字符,极差为 583 个中文字符。经对比分

33、析,发现学者撰写摘要的异质性程度较高,这可能是由于不同作者的学术背景和写作风格各有差异所致,而 GPT-4 作为一个大型语言模型,基于不同论文标题进行摘要创作时,其写作风格会显得更为相近。为深入研究 GPT-4 与学者写作风格的差异,我们对两者撰写的摘要中句子的数量(以句号作为分隔单位)进行了统计分析,结果如图 4 所示。图 4 显示,GPT-4 生成的摘要通常包含 3 8 个句子,以 5 7 个句子居多(约占总数的85%),其均方差为1.0,偏态为-0.2,峰度为-0.3。相较之下,学者撰写的句子数量分布在 1 11 句之间,以 2 4 个句子居多(约占总数的70%),其均方差为1.7,偏态

34、为1.2,峰度为2.6。由此推测,如果论文摘要中的句子数量特别多(大于 8句)或者特别少(小于 3 句),很有可能是由学者撰写,而非机器生成。7000 010.0 008.0 006.0 004.0 002.0 000.100200300400500600700valueProbability DensityGPT-4_Histogram with Normal Distribution Fit300400500600valueScholar_Histogram with Normal Distribution Fit1002000 007.0 005.0 004.0 002.0 001.0

35、000.Probability Density0 003.0 006.图 4摇 GPT-4(左)生成与学者(右)撰写摘要句子数正态分布拟合直方图摇摇进一步,分析 GPT-4 与学者撰写摘要句子数量的数据分布,结果如图 5 所示。图 5 显示:GPT-4 生成的句子数量的均值为 5.7,中位数为 6.0,上四分位数为6.1,下四分位数为 5.0;而学者撰写的句子数量的均值为 3.6,中位数为 3.5,上四分位数为 4.2,下四分位数为 2.0,这同样也说明了学者写作内容的异质性131摇第 9 期摇摇摇摇摇摇摇摇摇王一博,等:AI 生成与学者撰写中文论文摘要的检测与差异性比

36、较研究程度较高。图 5摇 GPT-4(左)生成与学者(右)撰写摘要句子数的箱线图3.2.2摇词汇特征与常用搭配分析对 GPT-4 生成和学者撰写摘要的高频词以及各自的独有词进行统计,结果如表 4 所示。其中,GPT-4中的独有词是指仅在 GPT-4 生成摘要中统计出现的词,且该词未出现在学者撰写的摘要中,学者撰写的独有词也同理。表 4摇 GPT-4 生成与学者撰写摘要的高频词和独有词摇摇摇摇摇摇摇 GPT-4 生成摇摇摇摇摇摇学者撰写摇摇摇序号高频词词频独有词高频词词频独有词1发展164资源整合发展149图情2本文146深入研究图书馆105服务理念3图书馆117资源

37、配置数据81社会化4提出111结合实际公共图书馆78基层5分析101深入分析建设68侵权6探讨97著作权服务68网民7研究95技术创新研究59图书馆事业8提供93资源共享智慧图书馆56维权9公共图书馆91实证研究体系55馆藏10方面90实地调查公共文化服务54国家战略11最后81政策法规资源53双一流12首先79知识传播技术51疫情13包括76知识产权保护构建51共同富裕14挑战75图书馆营销智慧49实施方案15服务75数据保护文化49竞争力16数据74知识经济融合48教育部17建议72新兴技术视频48城乡18通过68阅读空间提出45均等化19技术66读者需求理论45信息组织20 智慧图书馆6

38、2利用效率红色45总书记摇摇在排名前 20 的高频词中,尽管排名略有差异,但有 9 个词(占比 45%)是 GPT-4 和学者共同出现的高频词,包括“发展冶“图书馆冶“提出冶“研究冶等。此外,在前20 个高频词中还有11 个词(占比55%,表4 粗体显示)存在差异,其中 GPT-4 生成的高频词主要包括“本文冶“分析冶“探讨冶“提供冶等在论文中常见的泛化表达,而学者撰写的高频词则包括“建设冶“公共文化服务冶“资源冶“智慧冶等图书馆学领域经常研究讨论的学术主题。对整体统计结果进行分析,发现在 GPT-4 生成的词汇中,有 464 个词(约占 31.8%)在学者撰写的摘要中没有出现,也即前面提

39、到的“独有词冶。从内容上分析,学者撰写的独有词有很大一部分是与国家政策密切相关词,如“双一流冶“共同富裕冶“均等化冶“基层冶“总书记冶和“教育部冶等,这些在 GPT-4 撰写的内容中均未出现,这意味着 GPT-4 在撰写中文论文时很少结合国家政策或战略进行内容的组织和写作;进一步分析发现,GPT-4 和学者对于类似的含义使用不同的表述,例如学者惯用“实证分析冶,而 GPT-4 惯用“实证研究冶,学者惯用“著作权法冶和“著作权人冶,GPT-4惯用“著作权冶等。通过对学者和 GPT-4 撰写内容的词性进行标注和统计发现:GPT-4 更倾向于使用英文缩写词,如AI APP 等,而学者则更多使用一些代

40、词,如“我国冶“其中冶“这些冶等。进一步地,使用 Gephi 软件对 GPT-4 和学者撰写摘要中关键词的共现网络进行可视化分析,结果如图6 所示。节点大小代表关键词出现的频数,GPT-4 生成的摘要以“本文冶和“提出冶“本文冶和“探讨冶“本文冶和“分析冶等词对作为共现关系网络中的核心连接。而学者撰写的摘要则以“图书馆冶和“发展冶“图书馆冶和“建设冶、“图书馆冶和“服务冶等词对作为共现关系网络中的核心连接。其中,“提出冶和“发展冶“分析冶和“发展冶等词对的共现次数在 GPT-4 和学者都较高,说明这类词在写作时具有一定的通用性。随后,我们统计了摘要中通过 N-gram(2=N=10)处理后得到

41、的高频搭配,结果如表5 所示。表5 显示:GPT-4 与学者摘要中所用的词组搭配存在很大差异。从统计结果上看,排名前 20 个搭配中,有 15 个是不同的搭配(占比 75%,表 5 粗体显示),仅有 5 个是相同的搭配(25%),而且 GPT-4 生成内容中出现的高频搭配普遍更多一些。从内容上看,GPT-4 更倾向于使用归纳总结等学术话语体系,典型的搭配如“提出了相应的冶“本文旨在探讨冶“理论支持和实践冶“首先,文章分析了冶“最后,本研究针对冶“以期为我国冶等;而学者在撰写时更多地使用凸显实际含义的搭配,如“中国特色情报学冶“图书馆短视频冶“公共图书馆跨界合作冶“公共图书馆建筑空间设计冶“数字

42、人文视角下档案研究的冶“红色文化资源阅读推广冶等。231 摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇情摇报摇杂摇志摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇第 42 卷图 6摇 GPT-4(左)生成与学者(右)撰写摘要的关键词共现网络表 5摇 GPT-4 生成与学者撰写摘要内容中的常用搭配GPT-4 生成学者撰写常用搭配频次常用搭配频次提出了相应的23智慧化转型9本文旨在探讨17高质量发展的9“十四五冶时期14“十四五冶时期9在此基础上12的基础上9此外,本文还11中国特色情报学8理论支持和实践10图书馆短视频8公共

43、文化服务高质量发展9学习类视频8首先,文章分析了8公共文化服务高质量发展8最后,本研究针对8文旅融合的6数据交易法律规制7“十四五冶时期公共文化服务高质量发展5提出了相应的策略建议7公共图书馆跨界合作5“十四五冶时期公共文化服务高质量发展6公共图书馆建筑空间设计5发展提供了有益参考6我国公共图书馆的5首先,梳理了6阅读推广短视频5红色文献与红色专藏的5数字人文视角下档案研究的4技术的快速发展5的赋能机制4健康可持续发展5数据计量学的4提供理论支持和实践指导5红色文化资源阅读推广4以期为我国5实现高质量发展4智慧化转型5网络调查法44摇结论与展望本研究以图书馆学领域为例,采用多种有监督的机器学

44、习、深度学习分类算法和文本分析技术,对GPT-4 模型生成和学者撰写的中文论文摘要进行机器分类检测和内容差异性分析。在自动检测方面,本研究采用有监督的机器学习或深度学习分类模型可有效检测摘要是否由机器生成,在所选用的 6 种分类模型中,四种模型的 F1-Score均超过了 90%,有 55%的特征词同时出现在 Logistic、RF 和 LightGBM 三个分类器中,表明此类方法可有效区分一篇中文论文摘要是由 AI 生成还是由学者撰写。此外,GPT-4 生成摘要的重复率仅为 18.64%,能够通过目前常用的商用论文检测系统(如维普论文检测系统)的重复率检测。在文本内容分析方面,由 GPT-4

45、生成的论文摘要长度和句子数量差异较小,而学者撰写摘要的异质性程度较高。排名前 20 的高频词中,两者有 55%的词汇不相同;在 GPT-4 生成的词汇中,约 31.8%的词在学者撰写的摘要中未出现。学者常用与国家政策密切相关的词,但 GPT-4 鲜有使用;对于一些含义相同的概念,GPT-4 和学者在表述方式上也存在一定差异。排名前 20 的常用搭配中,两者有 75%是不同的搭配,且 GPT-4 生成内容中出现的高频搭配次数比学者更多。值得注意的是,GPT-4 惯用归纳总结等学术话语体系,具有较强的写作逻辑性,而学者凸显实际含义的搭配较多。此外,本研究仍存在一定的不足,主要有以下几点:一是仅以

46、图书馆学领域的高被引论文为研究样本,对于其他学科领域,研究结论的普适性仍需进一步研究验证,后续还可以对不同学科领域的论文进行对比分析;二是本研究仅关注了摘要部分的异同点,未来可进一步研究论文全文,包括引言、方法、结论等其他部分,以期更为全面地发现 AI 生成与学者撰写中文论文之间的差异。参考文献1摇贾雪丽,Oxares,张摇炯.一本书读懂 AIGC:ChatGPT、AI 绘画、智能文明与生产力变革M.北京:电子工业出版社,2023:2-4.2摇 Goodfellow I,Pouget-Abadie J,Mirza M,et al.Generative ad鄄versarial netw

47、orksJ.Communications of the ACM,2020,63(11):139-144.331摇第 9 期摇摇摇摇摇摇摇摇摇王一博,等:AI 生成与学者撰写中文论文摘要的检测与差异性比较研究3摇Clark A,Donahue J,Simonyan K.Adversarial video generationon complex datasetsDB/OL.(2019-07-15)2023-06-02.https:/arxiv.org/abs/1907.0657110.2139/ssrn.4329120.4摇杜摇雨,张孜铭.AIGC 智能创作时代M.北京:

48、中译出版社,2023:8-9.5 摇Oconnor S,Chatgpt.Open artificial intelligence platforms innursing education:Tools for academic progress or abuse?J.Nurse Education in Practice,2022,66(1):103537.6摇 Gpt generative pretrained transformer,Zhavoronkov A.Rapamy鄄cin in the context of Pascals Wager:Generative pre-trained

49、transformer perspectiveJ.Oncoscience,2022,9:82-84.7 摇Gpt generative pretrained transformer,Thunstr觟m A O,Stein鄄grimsson S.Can GPT-3 write an academic paper on itself,withminimal human input?DB/OL.(2022-06-21)2023-06-02.https:/hal.science/hal-03701250/document10.48550/hal.03701250.8 摇Tangermann V.89

50、Percent of college students admit to usingChatGPT for homework,study claims wait,what!?EB/OL.2023-04-27.https:/ https:/ Kutela B,Msechu K,Das S,et al.Chatgptssientific writings:Acase study on traffic safetyDB/OL.(2023-01-19)2023-06-02.https:/ Kutela B,Msechu K,Novat N,et al.Uncovering theinfluence o

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: AI 生成学者撰写中文论文摘要检测差异性比较研究

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。