DB4401∕T 12-2018 网络舆情分级与判定(广州市).pdf
《DB4401∕T 12-2018 网络舆情分级与判定(广州市).pdf》由会员分享,可在线阅读,更多相关《DB4401∕T 12-2018 网络舆情分级与判定(广州市).pdf(20页珍藏版)》请在咨信网上搜索。
1、 ICS 35.240.01 M 11 备案号: DB4401 广州市地方标准 DB4401/T 122018 网络舆情分级与判定 Classification and judgment for network public opinion 2018 - 10 - 10 发布 2018 -12 - 01 实施 广州市质量技术监督局 发 布 DB4401/T 122018 目 次 前言 . 1 范围 . 1 2 术语和定义、缩略语 . 1 2.1 术语和定义 . 1 2.2 缩略语 . 1 3 网络舆情评价一般流程 . 2 4 指标体系 . 2 5 指标量化 . 3 5.1 量化要求 . 3 5
2、.2 事件指标 . 3 5.3 网民指标 . 4 5.4 媒体指标 . 5 5.5 舆情态势指标 . 6 6 综合评价 . 7 7 等级划分与风险程度评价 . 7 7.1 等级划分 . 7 7.2 结果评价 . 8 附录 A(资料性附录) 文档主题生成模型 . 9 附录 B(资料性附录) 基于层次分析法(AHP)的权重计算方法 . 12 I II DB4401/T 122018 前 言 本标准按照GB/T 1.12009给出的规则起草。 本标准由中国共产党广州市委员会宣传部提出并归口。 本标准起草单位:广州市网络舆情信息中心、广州市标准化研究院、广州市云润大数据服务有限公司。 本标准主要起草人
3、:李伟滨、陈韶航、徐湛、萧玉珊、王贺珍、郑裕钊、曾庆贤、林毅、李永康、陈敏华、陈振兴、裴炜。 本标准是首次发布。 III DB4401/T 122018 网络舆情分级与判定 1 范围 本标准规定了网络舆情研判评价的一般流程、指标体系、指标量化、综合评价、等级划分与风险程度评价等内容。 本标准适用于广州市网络舆情的监测、评估、预警及相关软件开发等。 2 术语和定义、缩略语 2.1 术语和定义 下列术语和定义适用于本文件。 2.1.1 网民倾向性 Netizens tendency 网民对舆情的评价和态度取向。 2.1.2 焦度 Focal power 舆情在传播过程中最受关注点所处的状态。 2.
4、1.3 拐度 Flexion 舆情生命周期中拐点所处状态。 2.1.4 网站的PR值 PageRank 全称为PageRank,是google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分,PR值越高说明该网页在搜索排名中的地位越重要。 2.1.5 传播扩散度 Propagation diffusivity 影响网络舆情信息安全的重要指标之一, 它用来刻画某一具体的舆情事件或细化主题的相关信息在一定的统计时期内通过互联网呈现的传播扩散状况。 2.2 缩略语 下列缩略语适用于本文件。 AHP:层次分析法(The Analytic Hierarchy Process) LDA:文档主
5、题生成模型(Latent Dirichlet Allocation) 1 DB4401/T 122018 3 网络舆情评价一般流程 网络舆情评价工作应遵循一定的流程,主要包括以下三个环节,如图1所示: a) 舆情获取与分析:全面收集数据并获取网络舆情源头,对涉穗数据进行分类筛选,对影响因素进行细致辨识; b) 数据分析:构建层次结构的指标体系,选择科学可行的方法,进行定性和定量的数据处理; c) 评价与措施:对舆情的危险程度进行分析,得出评价结果,给出建议的处理方法。 图1 网络舆情评价一般流程 4 指标体系 网络舆情评价指标体系包括事件指标、网民指标、媒体指标、舆情态势指标等,这些指标又包含
6、各自的子参数,构成了一个层次的指标体系,如图2所示。针对不同的对象可选择不同的指标,包含但不限于这些指标。 舆情获取与分类 评价与措施 舆情数据获取 数据信息筛选 舆情分类 建立指标体系 选定评价方法 定性、定量分析 等级划分 结果评价 建议处理方法 数据分析 网络舆情评价一般流程 2 DB4401/T 122018 图2 网络舆情评价指标体系 5 指标量化 5.1 量化要求 5.1.1 对网络舆情评价各指标量化可采用定性或定量的方法,标度范围为0,1。 5.1.2 对指标定性量化以评价小组成员的平均值作为最终量化值。评价小组成员应受过专业培训。 5.2 事件指标 5.2.1 事件性质P11
7、事件指标(P1) 媒体指标(P3) 事件性质(P11) 事件波及度(P12) 事件风险度(P13) 网民活跃度(P21) 网民结构(P22) 情感倾向度(P23) 媒体权威度(P31) 传播扩散度(P32) 网民指标(P2) 网络舆情评价指标体系 舆情态势指标(P4) 传播阶段(P33) 热度(P41) 关注度(P42) 3 DB4401/T 122018 按照社会矛盾产生的原因对涉穗舆情信息主题进行分类, 通常包括公共安全、 群体事件、 重大灾害、官员负面、 经济财经、 城市治理、 意识形态等。 事件性质可以通过文档主题生成模型 (LDA, 参见附录A)进行聚类分析,其它合适的分析方法亦可使
8、用。 5.2.2 事件波及度P12 网络舆情波及度是衡量所有网络媒体中涉及到相关信息网站的比例指标。 这一指标的意义在于评判某一话题在网络中传播的广泛程度, 或网民在任意登陆一家网站后能够获取到相关信息的概率。 波及度为一个在0,1之间的值,可由公式(1)计算。 11,1121NijijNiiwSPw= (1) 式中: P12 波及度; N1 表示涉及到相关信息的网站数量; wi 表示网站的权重; Sj 表示网站涉及到与事件相关的信息程度; N 表示网站总数量。 5.2.3 事件风险度P13 网络舆情信息内容风险度是指某一特定的网络舆情信息内容可能造成的危害程度, 与评估者的着眼点密切相关,如
9、涉及重大安全事故、重大舆论危机等的负面舆情信息内容,风险度就较高。其评判结果是通过专家问卷调查确定的,可分为高风险、一般风险、无所谓、不敏感四档。 网络舆情信息内容风险度经过专家问卷调查确定,构建层次分析法(AHP,参见附录B)的判断矩阵建立。 5.3 网民指标 5.3.1 网民活跃度P21 网民活跃度通过单位时间内发布信息次数、回复次数来衡量,计算方式见公式(2)。 endstart21( )( ( )tt tA tPA tN=+ (2) 式中: P21 网民活跃度; A(t) 在t时刻相关事件的网民活跃值,见公式(3); tend 最近更新时间; tstart 发布时间; N 平滑参数,表
10、示网民活跃值大于N 时具有参考价值。 1( )( ( )(1)aNiiiiA twP tP t= (3) 4 DB4401/T 122018 式中: ( )A t 在t时刻相关事件的网民活跃值; aN 网民行为种类数量; iw 各种行为的权重,权重之和为1; ( )iP t 网民在t时刻对事件发布的信息、回复等各种对信息的关注行为次数。 5.3.2 网民结构 P22 网民结构包括年龄结构、教育程度结构等多个三级指标。通过文本挖掘技术的智能分析,得出一个在0,1之间的值,如:判别式方法、矢量距离法、贝叶斯方法、记分器方法等。 经过问卷调查、专家确定,将网民结构档次分为四档,分别是网民结构不好、一
11、般、好、很好。对应的网民结构得分如表1所示。 表1 网民结构得分表 网民结构档次 不好 一般 好 很好 得分 0, 0.25) 0.25, 0.5) 0.5, 0.75) 0.75, 1.0 5.3.3 情感倾向度 P23 网民情感倾向度是民众对现实或社会问题等态度、意见、看法、要求等主观性综合反映。情感倾向度指标用以刻画针对某一特定的网络舆情信息,民众所持有的观点态度(即民意)倾向。可以通过对网民回贴关键字、褒贬义词进行分析,统计出网民对该舆情情感倾向的概率分布。 5.4 媒体指标 5.4.1 媒体权威度 P31 媒体权威度衡量了某个媒体的可信度和影响力,是一个网络媒体的最重要指标之一,常以
12、PR值进行表征,见公式(4)。它包括了媒体的性质(政府,综合大站,娱乐大站,其他),网站新闻真实可靠的比例,以及网民大众对该网站的关注人数等。 3110PRP =(4) 式中: P31 媒体权威度; 网站的PR值,可由站长工具输入网址得到,取值范围为1,10。 5.4.2 传播扩散度 P32 指在一段时间内,网络舆情在不同网络媒体中传播的速度,媒体舆情扩散度越大,网络媒体影响力也大。 传播扩散度表征了某网络舆情信息在一定时间内的变化趋势, 可以反映舆情信息是在海量的舆情信息中湮没,还是有可能带来舆情泛滥,可以通过公式(5)进行计算。 32endstart12311 100PTTxxx=+ (5
13、) PR5 DB4401/T 122018 式中: P32 传播扩散度; Tend 最近的一次观察时间点; Tstart 之前的一次观察时间点; x1 Tend-Tstart网站新闻条数; x2 Tend-Tstart微博中有关事件条数; x3 Tend-Tstart微信中有关事件条数。 5.4.3 传播阶段 P33 传播阶段包括传播量、 传播权威度、 传播时间三个指标。 传播量为新闻的全网总数, 包括新闻网站、微信、微博。传播权威度为新闻传播网站的媒体权威度,可以通过公式(6)进行计算。 1233endstart33211xxxTTPa+=+(6) 式中: P33 传播权威度; a 一般情况
14、下,a=1.2; x1 网站新闻条数; x2 微博中有关事件条数; x3 微信中有关事件条数; Tend 最近的一次观察时间点; Tstart 之前的一次观察时间点。 当P330,0.2,那么该新闻处于萌芽期;当P330.2,0.45,那么该新闻处于上升期;当P330.45,1,那么该新闻处于爆发期;当P330.2,0.45,那么该新闻处于下降期(经过爆发期之后下降时);当P330,0.2,那么该新闻处于消退期(经过爆发期之后下降时)。 5.5 舆情态势指标 5.5.1 热度 P41 舆情关注度一般用主题下相关网页的数量来衡量。 可通过改写过的逻辑函数Y降低数量级作为参数,赋予每个不同类别的新
15、闻数量一定的权重,得到新闻的热度。热度指数能客观反映事件、人物、品牌、地域等在互联网上的受关注程度。热度指数所呈现的数值为0,1,数值越大,表明其网络受关注度越高。热度计算公式见公式(7)。 4111223344PYbYbYbYb=+(7) 式中: P41 热度; Y1 网站新闻的合成结果; b1 Y1的权重系数,权重比率为40%; Y2 微博的合成结果; b2 Y2的权重系数,权重比率为45%; Y3 微信的合成结果; b3 Y3的权重系数,权重比率为10%; 6 DB4401/T 122018 Y4 视频的合成结果; b4 Y4的权重系数,权重比率为5%。 211iixiYa=+ (8)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DB4401T 12-2018 网络舆情分级与判定广州市 DB4401 12 2018 网络 舆情 分级 判定 广州市
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。