大数据视域下基于粒计算的网络舆情研究进展.pdf
《大数据视域下基于粒计算的网络舆情研究进展.pdf》由会员分享,可在线阅读,更多相关《大数据视域下基于粒计算的网络舆情研究进展.pdf(4页珍藏版)》请在咨信网上搜索。
1、科技传播113信息科技基金项目:重庆市科技局自然科学基金面上项目(cstc2020jcyj-msxmX0048);重庆市教委科学技术研究计划项目(KJQN202003107,KJQN202203109)。作者简介:汪江桦,副教授,重庆电子工程职业学院,研究方向为信息分析与数据挖掘。汤建国,教授,重庆电子工程职业学院,研究方向为粗糙集与数据挖掘。0 前言大数据具有的大规模、多模态以及快速增长等特征对传统舆情分析方法带来了挑战,为此需要基于现有的研究成果,去探索和发展大数据挖掘的新理论与新技术,以适应大数据时代网络舆情分析的需求。粒计算是一种处理不确定性问题的有效方法,它模拟人类解决问题的自然思维
2、方式来处理数据,是处理大规模复杂问题的有效范式1。结合大数据本身和挖掘任务呈现出的多层次和多粒度特性,粒计算具有应对大数据视域下网络舆情分析挑战的可行性。粒计算的基本思想最早是由 Zadeh 在 1979年提出的2,起初被称之为信息粒,并在 1997 年将其正式命名为粒计算3。粒计算能够对复杂数据进行分解粒化来提高计算效率。目前粒计算中的模糊集方法和粗糙集方法已被学者们应用于网络舆情分析中,取得了一定的研究成果。1 模糊集方法模糊集是 Zadeh4提出的,它利用先验知识来对事物进行一个模糊的描述,在具体建模时,将先验知识表示为隶属函数,根据隶属函数确定的隶属度来衡量不同事物间的相似或接近的程度
3、。以下是模糊集的定义:设U是一个论域,xU,从U到闭区间 0,1 上的一个映射:0,1AU被称为U上的一个模糊子集,记为A。A称为A的隶属函数,()Ax称为x 对A的隶属度。通常又将模糊子集简称为模糊集。由于大数据网络舆情分析过程中要处理的信息具备模糊性和不确定性,模糊集方法正好是解决这一问题的有力工具。因此学者们基于此去探索将模糊综合评价、模糊神经网络、模糊推理和模糊集定性比 较分析等方法应用于网络舆情分析。1.1 模糊综合评价方法模糊综合评价方法基于模糊关系的合成原理转定性为定量,能够对模糊环境中受各类因素 影响的舆情问题做出有效评价。武慧娟等5用熵权法计算权重,构建网络舆情模糊综合评价体
4、系进行了舆情预警研判。郝楠等6构建了网络舆情预警模糊综合评价模型,结合专家知识和网民意向,使用 AHP 法计算权重,并进行了实证研究。陈培友等7构建了社交网络舆情风险预警模型,运用 ANP 法确定权重,基于灰色系统理论建立模糊评价矩阵,并进行了实证研究。杨靛青等8结合 TOPSIS 思想,构建了网络舆情态势 模糊综合评价模型,结合专家经验和有序比值计算权重,并通过实例验证了有效性。1.2 模糊神经网络方法模糊神经网络方法结合了模糊集与神经网络的优点,具有较强的自主学习能力,适用于网络舆情预测和情感分析。王铁套结合模糊集与 BP 神经网络9、Elman 神经网络10构建网络舆情威胁估计模型并进行
5、了仿真实验。胡悦等11运用改进的 PSO算法来优化模糊神经网络的性能,对微博话题的趋大数据视域下基于粒计算的网络舆情研究进展 汪江桦,汤建国摘 要 大数据视域下的网络舆情特征给传统的舆情分析方法带来了挑战,粒计算作为处理不确定性问题的有效工具,可有效应对挑战。文章对基于粒计算的网络舆情研究进行梳理和总结,展望了该领域的未来发展方向。关键词 大数据;粒计算;网络舆情中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2023)336-0113-0420238(上)科技传播114信息科技势进行预测。胡立松12运用遗传算法和蚁群算法对模糊神经网络进行优化,提高情感语义映射的准确率。龙帅
6、英13将模糊推理与循环神经网络相结合,契合脑电信号的模糊性和连续性,提取脑电信号的时间特征用于情感理解和识别。1.3 模糊推理方法模糊推理方法是指通过模糊集合及关系推理出不具备精确数值的结论,能够模拟人类思维进行舆情预警研判。李弼程等14基于 Atanassov15-16的直觉模糊集理论,先用直觉模糊综合评判方法得出因素隶属度,再用模糊推理进行舆情预警等级研判。张艳丰等17采用扎根理论提取指标,通过语义隶属度模糊推理对网络舆情进行监测和预警。肖鸿雁等18使用基于相似度的直觉模糊熵权法计算指标权重,通过直觉模糊推理进行微博舆情预警等级研判。林玲等19基于直觉模糊集,结合 专家经验得到直觉模糊评价
7、矩阵,运用模糊 Choquet 积分计算综合评价值,同时引入专家风险偏好进行网络舆情预警等级研判。1.4 模糊集定性比较分析方法模糊集定性比较分析方法借助架构理论和布尔代数运算,基于多案例通过集合的角度分析要素组态与结果的关系,进而解释因果关系20-22,适用于网络舆情的热点生成机制和回应路径等方面的分析。李晚莲等23选取 48 个突发公共事件,运用模糊集定性比较分析法对网络舆情热度生成机理进行研究,数据校准采用四值模糊集校准法和均值锚点法。刘宸玎24选取 30 个教育舆情案例,采用六值模糊集校准法,运用模糊集定性比较分析法对其生成机制进行研究。李茹歌等25选取 24 个高校突发事件,运用模糊
8、集定性比较分析法对高校负面网络舆情事件的回应路径进行研究。吕鲲等26采用扎根理论提取前因变量,结合模糊集定性比较分析法得出突发公共卫生事件网络舆情热点话题形成的组态路径。2 粗糙集方法粗糙集是 Pawlak27-28提出的用于处理不确定性问题的理论与方法,它是利用集合之间的逼近关系来对目标集合进行近似的描述。以下是粗糙集的定义:设U为论域,R是U上的等价关系,划分P=U/R=Y1,Y2,Yn,X是U的一个非空子集,则:X关于R的下近似:,X关于R的上近似:,若lowR(X)=uppR(X),称X为R-可定义集;否则,称X为R-粗糙集。粗糙集无需预先给定数据的特征即可在不确定信息下进行大规模的数
9、据挖掘,进 而提供成熟的决策方法,这一特点正好符合大数据视域下舆情分析的要求。因此学者们基于此去探索将粗糙集属性约简、三支决策粗糙集和多粒度粗糙集等方法应用于网络舆情分析。2.1 粗糙集属性约简方法粗糙集属性约简方法不需要先验知识,就可以有效去除冗余知识,简化特征集合29,因此常被用于舆情趋势和情感分析研究中的特征提取。裴佳音等30结合遗传算法,运用粗糙集特征约简提取影响因素,预测公共卫生事件微博舆情。蒲国林31运用信息增益进行决策表约简,再结合粗糙集属性约简方法获得最优特征子集,提升情感特征选择准确率。金纯等32结合二进制布谷鸟算法和粗糙集属性约简方法优化特征子集选择步骤,提高情感识别效果。
10、陈波等33运用粗糙集属性约简法实现情感词特征子集的精准选择,再结合多通道词向量进行文本情感分析。2.2 三支决策粗糙集方法在大数据网络舆情分析中,采集到的信息有可能具有不精确性和不完整性的特征,运用三支决策粗糙集能够以最小代价对确定异常和正常的行为进行决策。田海龙等34基于三支决策粗糙集对微博的观点句进行识别,用三支决策中的边界类解决微博主观性信息不全面的问题。谢骋等35将三支决策粗糙集用于视频异常 行为检测,用主题模型生成的低维特征训练得到三支决策分类器做出决策。万志超等36提出一种三支决策特征选择方法,利用三支决策确定决策域并处理特征词,降低情感倾向性分析中的特征词数量和维度。胡彦等37将
11、三支决策粗糙集运用于突发事件应急群决策,确定接收域和拒绝域,并用前景理论优化舆情指标值分析。2.3 多粒度粗糙集方法多粒度粗糙集是基于粗糙集构建的,它将经典粗糙集中的单一粒度扩展成多粒度的粗糙集,适用于大数据网络舆情的处理。窦慧莉等38将多粒度粗糙集中近似逼近的融合技术用于舆情预警决策规则挖掘,并聚类采样技术进行舆情数据压缩。张越兵等39结合文本数据的三层粒度结构,基于粒计算思想提出一种基于文本粒度结构的 sss 特征,并运用情感走向模型和三支决策粗糙集完成文本情感分类。张刚强40基于多粒度决策粗糙集模型,结合多粒度与序贯三支决策进行文本情感分析。3 研究展望1)模糊集和粗糙集的区别在于模糊集
12、的隶属科技传播115信息科技函数大多由专家凭经验给出,带有一定的主观性且缺乏精度,而粗糙集的隶属函数能够从待处理的数据中获得,是无需先验知识的客观方法。模糊集和粗糙集之间有较强的联系和互补性,结合两者可形成更强有力的粒度计算方法和理论。在后续研究中可以尝试将模糊集和粗糙集的优点结合起来从而进行大数据视域下的网络舆情分析,主观与客观相结合,提高舆情分析的准确性和有效性。2)在大数据视域下的网络舆情分析中,粒计算中的多粒度和跨粒度推理模型将成为有力的分析工具,可用于权衡决策粒度和决策代价,以及进行资源约束条件下的多粒度推理等问题的分析与处理,这些都是在未来研究中亟待解决的问题。参考文献 1梁吉业,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 视域 基于 计算 网络 舆情 研究进展
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。