欢迎来到咨信网! | 成为共赢成为共赢 咨信网助力知识提升 | 自信网络旗下运营:咨信网 自信AI创作助手 自信AI导航
咨信网
全部分类
  • 包罗万象   教育专区 >
  • 品牌综合   考试专区 >
  • 管理财经   行业资料 >
  • 环境建筑   通信科技 >
  • 法律文献   文学艺术 >
  • 学术论文   百科休闲 >
  • 应用文书   研究报告 >
  • ImageVerifierCode 换一换
    首页 咨信网 > 资源分类 > PDF文档下载
    分享到微信 分享到微博 分享到QQ空间

    社交网络“意见典范”及其趋同性——基于LSA的微博用户分析.pdf

    • 资源ID:717557       资源大小:3.05MB        全文页数:21页
    • 资源格式: PDF        下载积分:10金币
    微信登录下载
    验证码下载 游客一键下载
    账号登录下载
    三方登录下载: QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    验证码: 获取验证码
    温馨提示:
    支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    开通VIP
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    声明    |    会员权益      获赠5币      写作写作
    1、填表:    下载求助     索取发票    退款申请
    2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
    6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    7、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

    社交网络“意见典范”及其趋同性——基于LSA的微博用户分析.pdf

    1、 媒介批评 第十四辑ME D I A C R I T I C I S M新媒介学理社交网络“意见典范”及其趋同性 基于L S A的微博用户分析徐翔摘要:在开放、自主的社交网络系统及其用户内容生产中,用户是否走向相似与同化,以及在何种条件下走向相似与同化,是潜藏于社会化媒体中的异化风险.本文提出和探讨社交网络信息生产中“意见典范”的理论内涵及其趋同性,结合微博实证数据和L S A等研究手段加以分析,有助于丰富从内容模因到用户模因、从意见领袖到意见典范的研究视域延拓.用户作为意见典范的程度越高,则其相似于k个同典范度层级用户的程度也越高;用户作为意见典范的程度越高,则其趋同于顶部最高“意见典范”的

    2、程度也越高;任意两个意见典范之间的互典范程度和这两者的典范度之和成正相关.在意见典范作用传导和扩散至全局的条件下,全体用户相似于某意见典范的程度和该用户的典范度成正比,表现出社交网络趋向于意见典范的用户同化与增长的社会窄化.本文系国 家 自 然 科 学 基 金 项 目(项 目 号:)、上 海 市 级 科 技 重 大 专 项(项 目 号:S H Z D Z X )的阶段研究成果.关键词:意见典范;社交网络;用户相似性;意见领袖;潜在语义分析一、研究回顾与问题分析对于网络“意见领袖”的研究已成为传播学、社会学、管理学、营销学等诸多学科高度关注的领域.拉扎斯菲尔德等人提出“意见领袖”的概念,认为“意

    3、见领袖”指构成信息和影响的重要来源,并能左右多数人态度倾向的少数人.在“意见领袖”的影响力之外,还有一种“意见典范”的影响力模式,后者缺乏前者那样的充分理论自觉.如果说在社交网络中,意见领袖强调的是用户承担着讯息、意见、消息、内容、态度传递的功能,那么意见典范则强调用户作为内容整体的传递和流动.本节从以下层面依次提出现象并展开分析:(一)意见典范(P);(二)意见典范的相似关系;(三)意见典范的相似关系所表现的趋同性(P、P、P).(一)意见典范用户在UG C(用户生产内容)的自由广阔空间中,是否能成为“初心”中的自己,抑或“终将成为自己所讨厌的人”?在看似自主的自媒体表达和“人人时代”的社交

    4、网络言说中,通过言说而成为怎样的用户,是否并非自己的设定,而是为社交网络所“设置”?在此意义上,社交网络媒介不仅产生着经典理论中的“议程设置”效果,还可能产生着“用户设置”的效果:它不一定能影响用户怎么言说,但可以在一定程度上影响用户言说什么,以及用户通过言说而成为怎样的“作者”与用户.用户成为什么样的用户受到其他用户的影响或“设置”,或高或低地与一些“范本”“典范”用户产生相似性.社交网络中的高影响力用户与其他用户之间的“发布信息接受或反馈”“圈粉被圈粉”之间的关系,使其用户曝光度和影响势能更为强大.松村直弘(M a t s u m u r a)等 提 出 的 识 别 意 见 领 袖 的 影

    5、 响 力 扩 散 模 型(I n f l u e n c e朱洁:中西方“意见领袖”理论研究综述,当代传播 年第期,第 页.L a z a r s f e l d P a u l F敭 B e r n a r dB e r e l s o n a n dH a z e lG a u d e t 敭T h eP e o p l esC h o i c e H o wt h eV o t e rM a k e sU pH i sM i n di naP r e s i d e n t i a lC a m p a i g n敭N e wY o r k C o l u m b i aU n i v

    6、e r s i t yP r e s s 敭 敭C o h e n B 敭T h eP r e s s a n dF o r e i g nP o l i c y敭 P r i n c e t o n N J P r i n c e t o nU n i v e r s i t yP r e s s p 敭 敭社交网络“意见典范”及其趋同性 D i f f u s i o nM o d e l,I DM),通过用户对博主微博内容的评论及转发的语义相似度,描述博主的内容扩散及其对其他用户的影响.布拉沃(B r a v o)等人分析了政治意见领袖在推特中被追随、转推、提及的扩散能力.王晓光将博客用

    7、户分为核心博客与普通博客,博客用户的关注对象常常集中在特定的核心博客上,在线上容易陷入特定主题的交流社区.翁(W e n g)等人对推特的研究指出,用户和她/他的直接粉丝之间,存在着信息内容和主题上的同质现象.这些会导致用户发生与高影响力用户的同化,为用户的典范化与高影响力用户的信息相似性传递提供一定的实证基础.但是意见、帖子、主题等具体信息内容的传递,和用户内容整体特质构成的“用户内容样态”的传递是不同的范畴:前者的基本单位是帖子、意见等具体的内容;后者的基本单位则是把具体的内容按照用户个体整合后,显现出的因人而异的整体特征、内容气质.社交媒体的高影响力用户具有内容特征类型窄化的特征,吸引着

    8、意见领袖用户朝向特定方向与模式、类型偏转.例如张志安等人的研究显示,微博中公共讨论弱化,而营销类、娱乐类用户成为微博意见领袖群体的主流.有研究将新浪微博名人用户分为七类,并指出文化传媒类、商业财经类、文体明星类占据着最大的比重.关于微博意见领袖的分析指出,他们“在个人兴趣标签中,读书、新闻、股票这几项比例最高”.这些显现出意见领袖发布的内M a t s u m u r a N敭 O h s a w a Y敭 I s h i z u k a M敭 敭 I n f l u e n c ed i f f u s i o nm o d e l i nt e x tb a s e dc o mm u n

    9、 i c a t i o n 敭T r a n s a c t i o n s o ft h eJ a p a n e s eS o c i e t yf o rA r t i f i c i a l I n t e l l i g e n c e p p 敭 敭B r a v o R敭 B敭&M a r c E敭 D敭 V敭 敭 O p i n i o nl e a d e r s h i pi np a r l i a m e n t a r yT w i t t e rn e t w o r k s Am a t t e ro f l a y e r so f i n t e r a c

    10、 t i o n 敭 J o u r n a l o fI n f o r m a t i o nT e c h n o l o g y&P o l i t i c s p p 敭 敭王晓光:博客社区内的非正式交流:基于网络链接的实证分析,情报学报 年第期,第 页.W e n g J 敭 L i m E敭 P敭 J i a n g J 敭&e ta l 敭 敭 T w i t t e r r a n k f i n d i n gt o p i c s e n s i t i v ei n f l u e n t i a lt w i t t e r e r s 敭P r o c e e d

    11、i n g s o ft h e t h i r dA CMi n t e r n a t i o n a l c o n f e r e n c eo nW e bs e a r c ha n dd a t am i n i n g N e wY o r k U S A p p 敭 敭王国华、张勇波、王雅蕾、刘炼:微博意见领袖的类型特征与内容指向研究,电子政务 年第期,第 页.曹洵、张志安:社交媒体意见群体的特征、变化和影响力研究,新闻界 年第期,第 页.佟力强主编:中国微博发展报告(),人民出版社 年,第 页.曹洵、张志安:基于媒介权力结构的微博意见领袖影响力研究,新闻界 年第期,第 页.

    12、容中模板化的意味会得到加强.微博等社交网络中的用户并非宽泛与多样化的,而是有着限定性的、处于有限范围内的内容类型.社交网络中具有影响力的用户类型以及传播内容的偏倚,使得用户内容生产的形态表现出向某些优势类型、优势“样本”集中的趋势,为用户的同化提供着佐证与支持.基于社交网络用户在内容相似性方面的传导,本文聚焦社交网络“意见典范”的角色与现象,并由“意见典范”的内涵出发而进一步考察“意见典范”之间的关系以及“意见典范”角色对于微博用户整体构成的影响.对“意见典范”的界定如下(P):意见典范指的是社交网络内容生产中具有“范本”属性的用户;与他们在整体内容上越是相似和趋同的用户,则越可能具有在该社交

    13、网络中的高影响力;与他们在整体内容上越是趋异或不相似的用户,在社交网络中的影响力就越低.从内涵P 引申出其更为具体的内涵(代称P ):设某用户M具有“意见典范”的角色属性,则对于其他任意一个用户uy而言,uy和M在内容整体特质上越相似,则uy的影响力就越大;反之,uy和M在内容整体特质上的相似度越低,则uy的影响力就越小.(二)意见典范的相似关系与“意见典范”高度关联而自然延伸的问题是:作为“意见典范”,他们是多样化的、各有千秋、“各领风骚”的范本,还是单一化和趋同化的范本?在提出、检验“意见典范”(P)概念和效应的基础上,审视和分析其对于用户增强同化和封闭、消减多样异质性的作用,可以将其简称

    14、为趋同性.这里所指的趋同性强调:意见典范用户的内容特征不是发散的、多样化的,而是朝着特定的个体内容特征或用户“范本”发生趋同化,这个过程中出现用户的异质性不断消减、同质性不断增强的趋势.用户是否为多样化和去中心化的,或者说是否为趋同化的,是关系到社交网络用户的一个结构性的特征,也易引起激烈论争.本文从意见典范的相似性传导和P、P、P 这三个方面,检验意见典范所表现出的这种趋同性.该结果和一些流行观点、常识观感有相悖之处,但这正是其必要性所在.张玉晨、翟姗姗、许鑫等:微博“中V”用户的传播特征及其引导力研究 以罗一笑事件为例,图书情报工作,年第 期,第 页;生奇志、高森宇:中国微博意见领袖:特征

    15、、类型与发展趋势,东北大学学报(社会科学版)年第期,第 页;王国华、张剑、毕帅辉:突发事件网络舆情演变中意见领袖研究 以药家鑫事件为例,情报杂志 年第 期,第页.社交网络“意见典范”及其趋同性 图用户意见典范的内涵与用户内容相似性、意见典范相似关系(三)意见典范的相似关系及其趋同性:P、P、P 的提出对于任何一个具有“意见典范程度”的用户Ux,设该用户的意见典范程度排序为m;全体最低序位为,最高序位为M a x.考察他在意见典范的作用机制下,所发生和增强的与各种“标的”的相似性和趋同性.存在以下基本“标的”:a 和Ux自身具有同典范度的用户,可称之为意见典范的同层级用户(意见典范程度的序位最接

    16、近于m的k用户).此外是不同典范度的用户,这又包括两种:b 具有特殊性的一种用户,他们在典范度上居于全局的顶部,具有最高的意见典范程度序位,也可称之为顶部意见典范;c 未被包含在a或b之内的普通意见典范,他具有某个任意的意见典范程度.那么,对于任意的意见典范用户Ux而言(设其任意的意见典范程度的序位为m),他与a、b、c三种用户的相似关系如下图(图)所示,这恰构成图中分析意见典范用户趋同性的子问题向度.图意见典范的相似关系与假设P、P、P 基于“意见典范”自身的内涵与属性以及意见典范用户和上述三种“标的”的相似关系,本文的分析从朝向意见典范同层级用户的相似关系,意见典范朝向顶部意见典范的相似关

    17、系,意见典范之间的叠加相似关系,这三个连贯的方面依次展开.为行文简便,这三个方面的相似关系,依次简称为意见典范的层级趋同性、趋顶趋同性、相互趋同性,下面分别就这三方面进一步展开假设:分别为P(意见典范的层级趋同性),P(意见典范的趋顶趋同性),P(意见典范的相互趋同性).P 的提出与内涵:意见典范的相似关系与层级趋同性关于意见典范的相似化与趋同性,首先需要关注的一个方面是:越是高程度的意见典范,他们是否越能保持异质化与多样化?抑或越加趋向同化、重复化?对此容易产生两种误解.一种观点是,意见典范是多种多样的,大家似乎可以照着各种“范本”来“书写自我”;现实中,由于高影响力用户是多种多样的,也容易

    18、助长“高程度的意见典范是趋于多样化的”这种误判.另一种也很容易让人迷惑的观点是:即使高程度的意见典范不是趋于多样化的,它的多样程度至少是和中、低意见典范差不多的,也即分布和变化没有什么趋向性.根据P,意见典范是与他们越相似则影响力越高,与他们越不相似则影响力越低的用户.这样,对于高程度的任意两个意见典范Mx和My,虽然我们希望他们是足够差异化的,从而可以为微博社会提供更为多样化的生态;但是如果Mx和My的差异较大,则意味着:其他用户,在和Mx高度相似时,就不能同时和My也高度相似.只有在Mx和My也高度相似的情况下,这种相似性才会有效地传递,也即才能意味着和Mx高度相似时也和My高度相似.这就

    19、意味着,越是高典范度的意见典范就必须越相似,其中高程度意见典范通过与其他用户间的相似关系,显现对于其他用户影响力的“标杆”意义;或者说,通过与“范本”的相似度比对而形成的对于其他用户影响力的判定、预测能力(结合P、P ,以及后文M).例如极端情况下,典范度最高、具有完全的典范性的各个用户(“完全意见典范”),必须是完全相同的;因为如果其中哪个“完全意见典范”ut和其他的“完全意见典范”不同,就会造成:对于其他任意的某个用户ux而言,如果ux和ut完全相同(相似度等于),则由于ut是“完全意见典范”,所以ux的影响力必须是最高的;但是另一方面就会出现:ux和不包括ut的社交网络“意见典范”及其趋

    20、同性 其他“完全意见典范”并不充分相似(甚至相似度很低),但是依然存在ux的影响力是最高的情况 这就和P 及其内蕴的“完全意见典范”是矛盾的.当然,误解中的观点和观点也是很有市场的.有效反驳这两种观点的方法是实践检验,提出假设P:程度越高的同典范度用户,相互之间的相似程度越高,两者具有显著的正相关性.可将P 的内容称为“意见典范的层级趋同性”.P 的提出与内涵:意见典范的相似关系与趋顶趋同性在用户的典范度越来越高的情况下,他们会朝怎样的用户、以怎样的程度,发生越来越趋似、收敛、窄化的情况呢?对于由多行动者(a g e n t)构成的系统而言,其趋同策略包括平滑扩散趋同(f l a td i f

    21、 f u s i o nc o n v e r g e n c e)和非平滑扩散趋同.在非平滑的扩散趋同中,存在着具有优越性的趋同策略,使得系统最后的趋同结果会聚集于这些高地位的行动者的策略值.对于意见典范的扩散传导系统而言,是否存在这些具有更高优先性的趋同方向和趋同标的?结合P,用户典范程度越高,则他和最高的“完全意见典范”就必须有越高的相似度,从而保障自己在P 中对其他任意用户的影响力的“丈量”和预测能力.典范度越高的用户,就越不能“随心所欲”地任意长成自己想要的样子,而是必须和最高意见典范保持在一定的相似度范围内.对于其他非顶部的最高典范力用户而言,他们要想具有P 中更强的典范力,就只能

    22、向最强的意见典范“看齐”.和最强的意见典范越近似,其可预测性的典范力就越强,也即使得“和自己越相似的用户,就影响力越大;和自己越不相似的用户,就影响力越小”.如果一个用户任意野蛮“生长”成和最顶部意见典范非常不同的样子,那么,其他用户在和最强意见典范相似的情况下,就无法同时和这个迥异于他人的另一个人也相似.而根据P,和最强意见典范高度相似的那批用户,也会是强影响力的用户;但是如果一个想成为强意见典范的用户,却和一批强影响力用户只有低度相似,这和P 是矛盾的.从而也就意味着:要想成为强意见L i n Z敭 B r o u c k e M敭 F r a n c i s B敭 敭 L o c a l

    23、C o n t r o l S t r a t e g i e s f o rG r o u p so fM o b i l eA u t o n o m o u sA g e n t s 敭I E E ET r a n s a c t i o n s o nA u t o m a t i cC o n t r o l p p 敭 敭J i a n g J 敭 X i a X敭 敭 P r o m i n e n c eC o n v e r g e n c eI nT h eC o l l e c t i v eS y n c h r o n i z a t i o nO fS i t u

    24、a t e dM u l t i a g e n t s 敭I n f o r m a t i o nP r o c e s s i n gL e t t e r s p p 敭 敭 典范,就必须尽可能“长得像”最强的意见典范;越是长得像最强的意见典范,其对于其他用户影响力的可预测性就越强.因此值得继续求证的问题是:用户作为意见典范的程度和他趋同于最顶部意见典范的程度,是否具有正相关性?提出假设P:用户作为意见典范的程度越高,则和顶部意见典范的相似程度也越高,两者具有正相关性.可将P 的内容称为“意见典范的趋顶趋同性”,意指意见典范随着自身典范度的增加而越来越趋同于最顶部意见典范.P 的提出与

    25、内涵:意见典范的相似关系与相互趋同性任意两个微博用户之间的似同程度,是否和他们各自作为意见典范的程度,具有正相关性?这涉及用户之间的“互典范”问题.如果一个用户(设为ux)具有高典范度,意味着其他的任意某个高典范用户(设为uy)不能和该用户有着任意大的差异,而需要保持比较高的相似度范围,尽管可以不完全相同;而且该用户ux的典范度越大,这种差异的弹性和自由度越小.反过来也一样,uy的典范度越大,则ux和uy同样也不能有任意大的差异,而是需要把相似度保持在一定的范围以内.这样,ux和uy两个典范之间的相似度,就既和ux的典范度具有正相关性,又和uy的典范度具有正相关性.基于此,提出假设P:ux和u

    26、y之间的相似度,和ux的典范度加uy的典范度之和,具有正相关性.可将P 的内容称为“意见典范的相互趋同性”,意指不同的意见典范之间会发生相互的似同,而且这种似同程度和两者各自的典范度都具有正相关性.二、研究设计与实施我们在此以新浪微博为对象,检验分析社交网络意见典范的现象及其是否、如何导向用户的趋同性.(一)关于“意见典范”和“意见典范程度”的概念界定意见典范程度/典范度假设某个用户M具有“意见典范”的属性,则M会表现出以下效应(代称社交网络“意见典范”及其趋同性 为M):对于用户M而言,设其他任意用户有序地集合构成序列Uu,u,u,un,U中每个用户和M的内容相似度依次标为序列Ss,s,s,

    27、sn,U中每个用户的影响力依次标为序列Hh,h,h,hn,其中序列U和S、H中的每个元素顺序是严格一一对应的;那么可知,如果序列S和序列H的正向相关性、对应程度越强,则表示用户M的“意见典范程度”越强.用皮尔逊相关系数即可以简单而有效地反映S和H这两个数值序列之间的正向相关程度.其值在,之间.如果该相关系数不显著,则表示S和H缺乏明显的正向相关性,此时将相关系数值替换为.对于任意一个用户,都可以用上述方法得到一个皮尔逊相关系数(设为Px).这个值Px为正值且越是接近于时,表明用户x的“意见典范”的角色越鲜明、所产生的典范效应越强烈.而当Px时,用户x此时表现为“完全意见典范”,也即它会产生必然

    28、的、完全线性对应的、完全可预测的典范效应,而不会带有“时灵时不灵”或“多数时灵但仍有少数时不灵”的波动与误差.结合P、P 和M,将此种由Px反映出的程度,作为用户“意见典范程度”的测量方式(代称M).对于任一用户M,其意见典范程度的测量方式见图.图对于用户“意见典范程度/典范度”的测量方式“意见典范”和“意见典范程度”之间的关系结合“意见典范程度”的计算方式,任一用户都可以最终得到一个用于反 映其“意见典范程度”的数值Px,这个数值介于,之间.该值越大,表示用户对于全体任意用户所体现和发挥出来的“典范效应”越强烈,距离“完全意见典范”越接近,其作为“意见典范”的角色也越鲜明和越凸显.任何用户都

    29、可以得到其“意见典范程度”,正如任何用户都可以得到其“影响力程度”.我们不采取某个“门槛”值来二元划分“是不是”意见典范,而是根据“意见典范程度”值显示用户在“完全意见典范”(意见典范程度为)和“完全不是意见典范”(意见典范程度为)这个“两极”之中的游离.这个游标处于低值和负值的时候也是有意义的.(二)其他关键概念和指标的界定用户内容相似度把某个用户生产发布的n条帖子,组合为一个整体,来考察、提取其内容特征,并进而计算用户和其他用户之间的相似程度.对于用户整体内容,量化其特征的方式有很多种,例如V S M模型、L D A主题模型等.本研究选择潜在语义分析(l a t e n t s e m a

    30、 n t i ca n a l y s i s),把每个用户根据其内容转化为一个若干维的向量.用户影响力程度的测量指标选择最为常见、具有代表性的“粉丝数”反映用户作为“意见领袖”“大咖”的程度.用粗糙集理论发现,“粉丝数对能否成为意见领袖至关重要”.在实际操作中,由于用户粉丝量悬殊,因此采取对数函数转换后的形式:xn e w l o g(x).(三)样本选取与数据预处理根据新浪微博数据中心发布的 微博用户发展报告,新浪微博月活跃用户达 亿,月阅读量过百亿领域达 个.限于研究规模和巨量帖子抓取成本,本文未采取随机漫步等抽样方法,而是采取广覆盖、成本相对较低的多阶段抽样.刘志明、刘鲁:微博网络舆情

    31、中的意见领袖识别及分析,系统工程 年第期,第 页.新浪微博数据中心:微博用户发展报告,h t t p s:/d a t a w e i b o c o m/r e p o r t/r e p o r t D e t a i l?i d 年月 日.社交网络“意见典范”及其趋同性 我们从新浪微博首页 个内容版块(分别是:社会、国际、科技、科普、数码、财经、股市、明星、综艺、电视剧、电影、音乐、汽车、体育、运动健身、健康、瘦身、养生、军事、历史、美女模特、美图、情感、搞笑、辟谣、正能量、政务、游戏、旅游、育儿、校园、美食、房产、家居、星座、读书、三农、设计、艺术、时尚、美妆、动漫、宗教、萌宠、法律、

    32、视频、上海)中,获取其发布者和评论者共 个用户的数据,从中最终抓取到具有有效个人资料的、发帖数不少于 条的 个有效用户,以及每人所发的最多 条帖子;对这些有效用户抓取每人的前页关注者资料(因为新浪微博对每个用户最多只公开显示页、每页 个的关注者;若不足页则全部抓取).选取发帖数不少于 条的用户,再 经 过 去 重 等 清 洗 环 节,从 这 些 被 关 注 者 中 最 终 选 取 到 有 效 用 户 个.我们对用户进行统一横向比较.()时间段的统一,每个用户的帖子一律选取在 年月日到 年 月 日这两年间的.()帖子数量的统一,每个用户一律随机选取在上述两年间发布的 条帖子,少于该数量的用户不纳

    33、入比较范围.最后剩下的用于计算的用户为 个,粉丝量、发博量、关注数等主要指标都包含从数十到数万乃至数千万的大范围,各种重度/轻度用户、活跃/不活跃用户都得到良好的覆盖(图).粉丝规模关注他人数发微博数图样本用户的特征分布柱状图附注:粉丝数、关注数、微博数均为官方原始数值由l o g(x)转换得到(四)用户的内容特征提取与向量化:基于潜在语义分析的方法我们把单个用户的各条帖子无顺序拼接为一个长文本,先通过向量空间模型(V S M)得到每个用户的词频矩阵.在词频矩阵的获取中,最低词频数设 为,最大文档频率设为,只采用一元词.得到的词频矩阵有 个不同的词,也即 个用户形成的 行 列的矩阵;并转为经L

    34、 规范化的T F I D F矩阵X,转换函数为s k l e a r n T f i d f T r a n s f o r m e r(n o r m l ).然后对于矩阵X,采取潜在语义分析(L S A)进行降维和内容特征的提取.其中,对于矩阵X,进行奇异值分解可得:XT DT.L S A保留前k个最大的奇异值,也即通过TkkDkT来近似地表示原用户词项矩阵X.采用L S A把 的矩阵降维到 ,保留原信息的解释方差比(e x p l a i n e dv a r i a n c er a t i o)为,保留了原有的 万余维矩阵的大部分信息.保留不同维度下的解释方差比见图.图潜在语义分析(

    35、L S A)的误差变化(e x p l a i n e dv a r i a n c er a t i o)(五)用户的内容相似度计算根据L S A方法将每个用户根据其内容提取为 维的向量之后,进行用户相似度计算.任意两个用户Um和Un之间的内容余弦相似度范围在,数值越大表明越相似,计算方式表示为:R(Um,Un)()D u m a i s S T敭 敭 L a t e n ts e m a n t i ca n a l y s i s 敭A n n u a lR e v i e w o fI n f o r m a t i o nS c i e n c ea n dT e c h n o l

    36、 o g y p p 敭 敭社交网络“意见典范”及其趋同性 在式()的基础上进行扩展,采用“类平均法”(或称“簇平均法”,a v e r a g eg r o u p l i n k a g e),从对的用户相似度扩展到n对n的两组用户(每组中用户数量n)之间的相似度.也即,任意一组用户G(包含n个用户)和另一组用户G(包含n个用户)的内容相似度表示为:H G,G()nnxiGxkGR Uxi,Uxk()()(六)意见典范测度与微博意见典范分布的预调研我们对前述的 个微博用户样本,进行预调研准备,其典范度分布见图:图用户的意见典范程度分布柱状图从中可以得出的结论有:其一,意见典范分布较为广泛.

    37、其二,具有显著的且为正的皮尔逊相关系数的用户数量还是较多的,说明意见典范现象是客观存在的,不是一种纯粹虚拟的理论“构造”;其三,从意见典范的程度来说,微博中的“顶级意见典范”还是很稀少的.最高程度的意见典范,其指标值为.说明微博中虽然具有中、低程度的意见典范数量不少,但是指标值接近于的顶级意见典范乃至“完全意见典范”还未显现.三、意见典范及其趋同性的实证检验前文的三个假设P、P、P,自变量和因变量见下表概览(表).表:意见典范相似关系的假设P、P、P:自变量和因变量意见典范相似关系的三方面假设(P、P、P)自变量因变量因变量计算方式假设P:意见典范同层级用户的同化与闭合用户ux的 意 见 典

    38、范程度设与用户ux在意见典范 程度上相同或最为相近的k个用户为uk,因 变 量 为:ux与uk的用户内容相似度式()假设P:意见典范朝向顶部意见典范的同化与闭合用户ux的 意 见 典 范程度设意见典范程度最高的k个意见 典范 为uk,因 变量 为:ux与uk的用户内容相似度式()假设P:意见典范之间的叠加同化与闭合任意 两 个 用 户ux和uy,两者分别的意见典范程度之和用户ux和uy,两者之间的用户内容相似度式()(一)P 的检验对于P 的验证方法如下:用户x的典范度越高,则与x的典范度最接近的k个用户与x的用户相似度越高,两者具有正相关性.计算k取值,的范围内,P 全部成立.在k取上述 种

    39、不同参数的全部情况下,P ,样本数N .且斯皮尔曼相关系数全部稳定在 的区间内;而皮尔逊相关系数除了当k的个数为和 时低于(分别为 和),其他全部情况,都稳定在 区间内.(图)社交网络“意见典范”及其趋同性 图P 检验结果结论:P 是成立的,同典范度的用户会随着典范度的增大而越来越增强彼此的相似度,发生消减多样性的趋同.(二)P 的检验选取用户中意见典范程度最高的顶部k个用户(选取k).如果用户恰好也是这 个顶部用户群中的一个,则剔除自身后计算和顶部群体的相似度.一个用户和一群顶部用户的相似度,同样通过式()计算.用户的典范程度和该用户与最顶部典范用户的平均相似度之间,两者皮尔逊相关系数为(p

    40、 ,n ),斯皮尔曼相关系数为(p ,n ),见下图(图).图不同典范度的用户与顶部k个典范程度最高用户的平均相似度(横轴为用户的典范度,纵轴为用户与顶部k个典范程度最高用户的平均相似度k )结论:P 成立,用户趋同于顶部典范,而且越是典范度高的用户,这种趋同的程度也越高.(三)P 的检验首先,计算每个用户和其他每个用户的相似度(不包含用户和自身的相似度),将得到 的 相 似 度 序 列 命 名 为Si n t e r,长 度 为 ()个数值.然后按照同样的用户顺序,计算每个用户和其他每个用户的典范度之和(不包含用户和自身的典范度之和),得到典范度之和的序列命名为Mi n t e r,长度也为

    41、 个数值.Si n t e r和Mi n t e r中的每个数值,都是严格对应着相同一对用户之间的典范度之和或相似度:Si n t e r和Mi n t e r具有正相关性,才意味着P 是有统计显著性的.Si n t e r和Mi n t e r之间的皮尔逊相关系数为 (p ,N ),P 可以得到支持.结论:意见典范用户会发生相互之间的趋同与闭合,而且两者的相似程度和两者的典范度之和成正相关,而非负相关或无相关.用户个体不是随意、任意“生长”的.用户长成什么样子,受到他所处的媒介场中的其他用户的制约,并且自身也作为一环,再度介入这个用户相似性传递之中.这最终影响到整个社交网络的同化,带来社交网

    42、络用户的重复和趋同.四、结语:意见典范的意味与延拓本研究集中验证了微博“意见典范”减少用户多样性和丰富性、增强重复的趋同性,有助于丰富对社交网络中的影响力流动,从内容模因到用户模因、从意见领袖到意见典范的研究视域延拓.用户随着典范度的提升,而展现出自我层级同化、典范相互趋同、朝向顶部的趋同化.(一)从开放性到趋同性社交网络用户是内容相似化和趋同化的,还是内容多样化、异质化的?一些较为主流的观点纷纷支持社交网络的用户多样性.在此背景下,社交网络的“意见典范”似乎很容易和多样化关联起来:他们看起来似乎是多种多样的典范,是各个细分领域的范本.但是本研究基于意见典范的趋同性及其实证社交网络“意见典范”

    43、及其趋同性 检验导向用户的趋同化与去多样化,而不是在“人人都有麦克风”语境下的多样话语主体.处于趋同中心的是最高程度的“意见典范”,而由中心向边缘的则是程度逐渐减弱的意见典范;越是靠近中心圈的用户,彼此之间越是趋同,和中心越是趋同;越是远离中心的外圈用户,彼此之间的相似度越低,和中心用户的相似度也越低.(二)从意见典范到意见领袖一些观点会质疑,由于意见典范并不是现实中直接可感的对象,而只是我们抽象出来的一个理论对象和概念而已,是否和具体的实践缺乏紧密联系呢?这个问题并没有构成实质影响.除了理论探索的意义和价值外,意见典范还可以在实际的微博或其他社交网络中转化为实际对象.谁在某种程度上是意见典范

    44、或具有意见领袖的角色加持,谁就会在某种程度上具有和展现意见典范的闭合逻辑.由于意见典范涉及影响力的预测,在这个过程中,每个用户是和自己完全相似的,因此如果自己的意见典范程度越高,相应地其粉丝规模也理应越高,两者需要有正相关性.经计算,用户的意见典范程度和用户粉丝量体现出显著的正相关性,皮尔逊相关系数为 (p ,n ).这说明,意见领袖同时也是意见典范.而后者是前者经常被忽视的一个角色和功能.同时,这也意味着意见典范在P、P、P 中的趋同性,也会通过意见领袖的属性而传导与呈现,下文分别将其命名为P L、P L、P L.见图:图意见领袖的相似关系与趋同性的假设 关于假设P L、P L、P L 中自

    45、变量和因变量的内涵,见下表(表),同时也可参考表:表:意见领袖趋同关系的假设P L、P L、P L 中的自变量与因变量意见领袖相似关系的三方面假设对应的关于意见典范相似关系的假设自变量因变量因变量的计算方式P L:意见领袖同层级用户的同化P:意 见 典 范 同层级用户的同化用户ux作为意见领袖的程度设与用户ux在意见领袖程度上相同或最为相近的k个用 户为uk,因 变量为:ux与uk的 用户 内容相似度式()P L:意见领袖朝向顶部意见领袖的同化P:意 见 典 范 朝向顶部意见典范的同化用户ux作为意见领袖的程度设意见领袖程度最高的k个 用 户 为uk,因 变 量为:ux与uk的 用 户内 容相

    46、似度式()P L:意见领袖之间的叠加同化P:意 见 典 范 之间的迭加同化任意两 个用 户ux和uy,两 者分别作 为意 见领袖程度之和用户ux和uy,两者之间的用户内容相似度式()基于同一批数据的验证结果支持了该判断:P L:对于用户ux,如果ux的粉丝规模越大,则他和粉丝规模相同或最接近的“同层级”的k个用户之间的平均相似度也越大.下图(图)显示,k取值在,的范围,P L 都是成立的;全部相关系数P ,N .社交网络“意见典范”及其趋同性 图 各种粉丝量“最接近”用户个数k值下P L 检验结果附注:图横轴为粉丝量最高的用户个数(K),纵轴为用户典范度&该用户与K个粉丝规模最接近用户的相似度

    47、之间的相关系数及其P值 P L:对于任意一个用户ux,如果ux的粉丝规模越大,则他和全体用户中粉丝规模最大的“顶部”k个用户之间的平均相似度也越大.下图(图)显示,k取值从,的范围,P L 都是成立的;相关系数的p值全部小于 .此时计算的样本数n全部等于 .图 前k个最高粉丝量用户个数下P L 检验结果附注:图横轴为典范度最接近用户个数(K),纵轴为用户典范度&该用户与K个粉丝规模最高用户的相似度之间的相关系数及其P值 P L:对于任意两个用户ux和uy,两者的粉丝规模之和越大,则两者的相似度也越大.采取和前文P 类似的检验方法,但是把典范度指标替换为粉丝量指标,其他不变.也即,得到的两组变量

    48、,一组是全体用户两两之间的相似度序列(不包含用户和自身的相似度),此处和P 的检验中是相同的,仍然为Si n t e r;另一组是用户两两之间的粉丝数规模之和(不包含用户和自身的粉丝规模之和),用户的顺序和P 检验中的Mi n t e r以及Si n t e r完全相同,可称之为Fi n t e r.则Fi n t e r和Si n t e r的皮尔逊相关系数为(p ,N ).此处得到的相关系数较之其他假设要低,原因可能是相互趋同的作用机制较之P L、P L 更复杂,受到的复杂干扰因素更多,经由传导之后发生了更大的衰减.但总体上,P L 并未否定这种“相互趋同性”的显著性及其方向,未得到负相关

    49、或不相关的结论.如果意见领袖有着被忽视的“意见典范”的角色,那么它们就会被传导意见典范的同化逻辑,其结果就是意见领袖用户的封闭.实证结果明显地支持了这一点.现实中,这种角色传导还会有其他的向度,这增添了社交网络用户同化闭合的多种路径与潜在空间.(三)从微观到全局意见典范的相似关系及其最终表现出的闭合容易引起的一个疑问是,分析这些“细碎”的用户,还有什么更深层次的意义?其中的一个意义,是这些微观机制对于宏观网络的影响.根据前文已验证的结果,越强的意见典范和其他的典范度相同或不相同、典范度高或低的用户,都具有更强的相似性.由此,将之扩展到宏观层面,尝试提出拓展性的假设E:用户的意见典范程度越高,则

    50、用户和其他用户的总相似度越高,两者具有正相关.从意见典范的内涵(P)本身,难以直接推断出E 是否成立.但是P、P、P 的实证结果的成立,给了推测E 的一定基础.参照前文方式继续检验.对每个用户ux,结合式()计算他和其他全体用户(Gx)的总相似度,由于式计算出来的只是ux和Gx的平均相似度,因此再乘以Gx中的总人数(本案例为 人)即可得:H(ux,Gx).统计检验结果是支持E 的:用户的意见典范指标,和用户与其他全体用户的相似度之和,两者的皮尔逊相关系数为(p ,N ),斯皮尔曼相关系数为(p ,N ).全体用户在和意见典范变得越来越像,而且这种相像的程度,和意见典范本身的典范度是正相关的,表


    注意事项

    本文(社交网络“意见典范”及其趋同性——基于LSA的微博用户分析.pdf)为本站上传会员【自信****多点】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表




    页脚通栏广告
    关于我们 - 网站声明 - 诚招英才 - 文档分销 - 便捷服务 - 联系我们 - 成长足迹

    Copyright ©2010-2024   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:4008-655-100    投诉/维权电话:4009-655-100   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   



    关注我们 :gzh.png  weibo.png  LOFTER.png