基于SnowNLP-LDA的突发公共卫生事件网络舆情主题分析.pdf
《基于SnowNLP-LDA的突发公共卫生事件网络舆情主题分析.pdf》由会员分享,可在线阅读,更多相关《基于SnowNLP-LDA的突发公共卫生事件网络舆情主题分析.pdf(4页珍藏版)》请在咨信网上搜索。
1、第 39 卷 第 6 期2023年6月商 丘 师 范 学 院 学 报JOURNAL OF SHANGQIU NORMAL UNIVERSITYVol.39 No.6June,2023收稿日期:2022-04-09基金项目:甘肃省软科学项目(20CX9ZA062)作者简介:王 彤(1999),女,河北石家庄人,兰州财经大学硕士研究生,主要从事电子商务、数据挖掘的研究;王玉珍(1970),女,甘肃山丹人,兰州财经大学教授,硕士,主要从事电子商务、数据挖掘的研究.基于 SnowNLP-LDA 的突发公共卫生事件网络舆情主题分析王彤,秦精俏,王玉珍(兰州财经大学 信息工程学院,甘肃 兰州 730020
2、)摘 要:突发公共卫生事件舆情危机一旦爆发会引发民心不安,为及时有效研判和引导网络舆情,提升政府部门的应急管理能力,突发公共卫生事件舆情主题分析就显得尤为重要.利用“知微事见”,从近两年国内最具社会影响力的突发公共卫生事件中,选取影响力指数最高的事件,基于 SnowNLP 模型对事件发生后政务媒体的相关评论信息进行情感分析,以可视化方式,将网民情感划分为形成期、爆发期和衰退期.并通过 LDA 主题模型,得出每个时期的主题分类,从而为突发公共卫生事件发生后相关政府部门对网络舆情的把控和引导提供支持.关键词:网络舆情;主题分类;情感分析 中图分类号:G203 文献标识码:A 文章编号:1672-3
3、600(2023)06-0011-04SnowNLP-LDA based online public opinion topic analysis of public health emergenciesWANG Ton,QIN Jinqio,WANG Yuzhen(Lnzhou University of Finance and Economics,Institute of Information Engineering,Lnzhou 730020,China)Abstract:Once the public opinion crisis of public health emergenci
4、es breaks out,it will cause public anxiety.Inorder to timely and effectively study and guide network public opinion and improve the emergency managementability of government departments,the subject analysis of public opinion of public health emergencies is particularlyimportant.This paper,by using k
5、now what micro see,from the most social influence at home in the past two yearsin public health emergencies,select highest influence events,model based on SnowNLP media comments to theincident government affairs information analysis of emotion,in visual way,the netizens emotion into formation,theout
6、break period and decline.Through the LDA theme model,the topic classification of each period is obtained,so asto provide support for the control and guidance of online public opinion by relevant government departments after theoccurrence of public health emergencies.Key Words:network public opinion;
7、subject analysis;sentiment analysis近年来,突发公共卫生事件频发,随之舆论生态发生深刻变化,正确引导舆论工作面临新的挑战.在理论界,不少学者从不同角度就事件发生后如何进行舆情分析及舆论引导展开了一系列的研究,比如,新闻和情报学领域的研究者,从信息安全、情报管理等视角围绕舆情的形成过程1、趋势预测2、社会情感分析3、谎言识别4、预警研究5、用户传播6等主要问题,进行了深入研究;公共管理领域的研究者,围绕典型事例的舆情演化传播过程与路径7、引导分析方法8、政府网络舆情的规范化建设9等问题进行了深入研究,从而发现政府危机处理过程中折射出的深层社会问题;系统科学领域的
8、研究者则重点利用大数据模拟和实验分析等方法,建立网络舆情危机传播的动力学模型10,对舆情形成机理和演化过程进行研究11,为政府部门合理引导网络舆情提供帮助.诚然,虽然各个领域的专家与学者们,已在各个层面上对突发公共卫生事件网络舆情展开了不同程度的研究和探索,但这些研究者们多从各自专业视角分析了突发公共卫生事件发生后的网络舆情特点,而缺乏从专业融合角度对网络舆情的发展规律和引导对策进行综合性研究的成果.据此,本文基于网络空间意识形态安全相关理论,融合使用计算机科学、管理学、情报学等领域研究方法,以具体事例的时实数据为主要分析对象,采用可视化方法揭示了政务媒体话语引导对网民心态平复起到的作用,并通
9、过图表方式展现了不同阶段网民所关心的主题,为政府部门在突发公共卫生事件发生后,如何进行正确的舆论引导提供参考.1 模型构建本模型旨在系统地挖掘网民对突发公共卫生事件情感态度和关注主题,其过程包括数据收集与预处理、词云绘制、情感分析以及主题挖掘 4 个步骤(如图 1 所示).首先,选择具体突发公共卫生事件作为研究对象,对其评论数据进行收集、清洗与预处理;其次,对评论数据进行词云分析,并对其进行可视化呈现,捕捉网民重点关注内容.再次,运用 SnowNLP 模型分析网民情感,量化得分,并以此划分网民情感变化的各个阶段,最后,使用 LDA 主题模型挖掘网民在各个阶段对突发公共卫生事件的关注重点,为舆论
10、正确引导提供针对性的帮助.图 1 分析过程图1.1 数据收集与预处理借助集搜客软件爬取新闻事件评论区的文本数据,获得分析所需的原始语料.由爬虫爬取的评论数据,存在大量噪声数据,像常用表情符、键入特殊符、网页标签等,因此,文本数据需要清洗,通过 jieba 分词、去除停用词、词性标注等方式,去除情感表达不明显或矛盾的内容.1.2 词云分析运用 TextBlob 中的 WordCloud 子包对预处理后的数据进行词云绘制,出现次数较高的词会以可视化的方式呈现.借助词云图能高效地排除低频低质的信息,弱化非关键区域,突出呈现关键信息.1.3 评论情感分析首先通过 TextBlob 中的 SnowNLP
11、 子包来计算每条评论的情感得分,其次以天为单位运用均值法计算其每天的情感均值,并以可视化的方式呈现,最后通过情感得分进行事件阶段的划分.1.4 LDA 主题挖掘基本步骤评论主旨挖掘即 LDA(Latent Dirichlet Allocation)主题模式,是一个无监督学习的三层(词语、主旨、文档)模式,它是将一篇文档的所有词汇信息以一定的概率分布到一个主题上,并从这一主题中选择词语,文档到主题、主题到词语的过程都服从多项分布.其基本原理就是在 ldplsa 三个模型的理论基础上进一步通过添加贝叶斯架构中的模块而逐步发展产生起来的.具体步骤如下:步骤一,对文档集合中每篇文档的 d 做分词处理,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 SnowNLP LDA 突发 公共卫生 事件 网络 舆情 主题 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。