基于在线评论的集中式长租公寓租客需求研究:以魔方公寓为例.pdf
《基于在线评论的集中式长租公寓租客需求研究:以魔方公寓为例.pdf》由会员分享,可在线阅读,更多相关《基于在线评论的集中式长租公寓租客需求研究:以魔方公寓为例.pdf(6页珍藏版)》请在咨信网上搜索。
1、基于在线评论精准识别、分析租客需求,是企业提升运营质效的重要突破口,对于推动长租公寓行业高质量发展具有积极的现实意义。选取魔方公寓作为研究对象,通过网络爬虫技术获取集中式长租公寓租客在线评论数据,使用基于TF-IDF、Wo r d 2 V e c 与K-means的词语聚类方法构建租客需求维度评价体系。采用情感分析方法对各维度满意度进行量化分析,并通过对评论数据的统计分析计算各需求维度的关注度。通过引入IPA分析模型,综合考虑租客需求关注度和满意度的相对关系。结果表明:企业要维持其在管家服务态度、硬装环境和公寓区位方面的优势。关键词:集中式长租公寓;在线评论;租客需求;词语聚类;IPA分析中图
2、分类号:F293.3文献标识码:A文章编号:16 7 4-8 8 5 9(2 0 2 3)0 3-14 8-0 6D0I:10.13991/ki.jem.2023.03.026Research on Tenant Demand of Centralized Long-term Rental Apartment Basedon Online Comments:Taking MoFang Apartment as an ExampleTANGQinghuil,2,WEI Xiangxian,WUMingyuel(1.College of Management Engineering,Qingdao
3、 University of Technology,Qingdao 266520,China,E-mail:;2.Research Center for Smart City Construction and Management,College of Management Engineering,Qingdao Universityof Technology,Qingdao 266520,China)Abstract:An important breakthrough for enterprises to enhance the quality and efficiency of opera
4、tion lies in the accurateidentification and analysis of tenant demand based on online comments.It has positive practical significance for promoting thehigh-quality development of the long-term rental apartment industry.Taking MoFang Apartment as a case,the web crawlertechnology is used to acquire th
5、e online comment data of centralized long-rent apartment tenants,and the evaluation system fortenant demand dimension is established by using the word clustering method based on TF-IDF,Word2vec and K-Means.Theemotion analysis method is used to carry out the quantitative analysis for the satisfaction
6、 of each dimension,and the statistics of thecomment data is used to calculate the attention of each demand dimension.The relative relationship between tenant demand attentionand satisfaction is comprehensively considered by introducing the IPA analysis model.The results found that enterprises should
7、maintain their advantages in housekeeper service attitude,hardscaping environment and apartment location.Keywords:centralized long-term rental apartment;online comments;tenant demand;word clustering;IPA analysis长租公寓是国内租赁生态的重要组成部分,其可持续运营是完善住房租赁市场的重要手段。相较于分散式长租公寓,集中式长租公寓因统一管收稿日期:2 0 2 3-0 3-0 4.基金项目:山
8、东省住房城乡建设科技计划项目(2 0 2 2-R1-3);青岛市哲学社会科学规划项目(QDSKL2101190).理、配套完善、规范透明等优势更具发展空间。预计2 0 30 年中国集中式长租公寓需求规模将超过1200万套,即将成为增长最快的房屋租赁细分市场之一 2 。伴随租住需求的不断变化和升级,准确把握并满足租客需求,不断提升长租公寓租住体验,是企业获得竞争优势的关键,直接关系到企业的生149汤青慧,等:基于在线评论的集中式长租公寓租客需求研究:以魔方公寓为例第3期存与发展 3。大数据时代,在线评论作为用户偏好表达的重要渠道,是企业发现用户需求的重要数据来源 4 。基于在线评论精准识别、分析
9、租客需求,是企业提升运营质效的重要突破口,对于推动长租公寓行业高质量可持续发展、进一步深化住房制度改革具有积极的现实意义。目前已有学者对长租公寓租客需求展开研究。李画儿等 5 通过对长租公寓相关案例和文献归纳总结,构建租客居住体验评价体系,并运用问卷调查方式对各评价因素进行多维度分析,但评价要素的选择难以全面地涵盖租客需求。曾德等 6 结合长租公寓现有研究及武汉市行业现状,构建了租客居住满意度模型,基于问卷调查数据利用多元线性回归分析方法对租客居住满意度影响因素进行分析,但研究结果受问卷设计质量影响较大,同时难以避免调查成本高、反馈周期长等问题。邵必林等 7 基于马斯洛需求理论构建了包含租客基
10、础需求和潜在需求的长租公寓运营管理质量评价体系,较好地克服了时间和地域的限制,但基于专家打分数据确定指标权重具有较强主观性,同时缺乏对租客需求实现程度的多维全面分析。随着Web2.0时代的发展和企业信息化程度的提高,电商平台、社交媒体中积累的大量非结构化在线评论,为学术界提供了新的数据收集渠道,许多学者通过文本挖掘方法探究在线评论中反映的用户需求 8 -10 。相比于传统研究方法,在线评论提供的信息具有数据公开易获取、信息量丰富、受访者主动独立参与反馈等优势 11-12 。同时,基于在线评论的文本挖掘方法尚未应用到长租公寓领域,对集中式长租公寓平台积累的租客在线评论缺乏深人的挖掘分析。鉴于此,
11、本文基于文本预处理后的在线评论数据,使用Word2Vec模型综合考虑评论文本中词语间的语义关系,通过K-means算法对特征词进行聚类分析,进而构建了更加客观、全面的租客需求维度评价体系。结合情感分析方法对租客需求满意度进行量化分析,并通过对评论数据的统计计算各需求维度的关注度,避免了传统研究方法在数据收集与分析过程中存在的局限性,能够真实、可靠地反应租客需求。通过引人IPA(Imp o r t a n c e Pe r f o r ma n c eAnalysis)分析模型,可弥补现有研究从单一维度对租客需求进行分析的局限性,综合考虑租客关注度和满意度的相对关系,明确企业对租客在各个需求维度
12、的改进策略,以提高了研究结果与管理决策的相关性。1研究设计研究流程分为数据采集及预处理、租客需求维度提取、关注度满意度计算、IPA分析四部分。1.1数据获取与预处理1.1.1数据获取魔方生活服务集团是国内具有代表性的集中式长租公寓运营商 13。通过魔方生活服务集团官网对各城市门店数量及占比进行统计,其中一线城市和新一线城市门店数量占比达到了9 4%。由于在一线及新一线城市房价高企,城市居民对住房租赁需求量较高,相比于二线城市房源供应量处于高位。因此本文以魔方生活服务集团官网作为数据获取的渠道,通过对数据挖掘分析能够较好地反映一线城市及新一线城市租客的真实需求。为保证评论文本的有效性,按照以下处
13、理方式进行评论文本的筛选:一是删除存在明显赞美及毁的评论文本,以保证数据分析的准确性;二是由于同一租客的重复评论会影响统计分析结果,因此对同一租客不同时间段的评论进行筛选,选择表达内容无重复的文本;三是选取评论字数在10 30 0 字之间,且表达内容完整的文本。1.1.2文本预处理由于爬取的租客在线评论文本存在较多的穴余信息,需要对筛选后的原始语料进行文本预处理。其主要包括文本分词和停用词处理,通过文本分词将大段的评论文本切分为小型信息单元,以便进行特征词的提取和文本向量的构建。通过停用词处理,去除文本信息量较少的字词及标点符号,以降低文本噪声,提高分类器的性能。本文的具体处理方式为:一是使用
14、Python中的jieba分词工具包对评论文本进行切分,同时添加自定义语料词库,保证文本分词的准确率;二是使用哈工大停用词库进行停用词的过滤;三是将意思表达相同的词语统一替换为同一词语。1.1.3基础词典构建对于文本进行情感分析的研究方法,主要包括基于情感词典、基于传统机器学习、基于深度学习和多策略混合 14 。对在线评论的短文本情感分析中,基于情感词典的研究方法使用最为广泛,因此本文采用此方法对租客需求满意度进行情感分析。在进行分析前需要构建基础词典,基础词典是在线评论中能够体现租客情感色彩的词语集合,主要分为情感词、修饰词 15 。通过情感词可以判断租客对150:程报理第37 卷学管于所提
15、及评价维度的正负情绪,修饰词则用于体现其情绪的强弱程度(1)情感词构建。首先对知网HowNet情感词典和苏州大学人类语言研究所构建的电商领域词典进行整合,作为基础情感词词典,并将所挖掘的评论语料中词频较高的词语进行人工筛选补充,设置正向情感词权值为1,负向情感词权值为-1,补充词典如表1所示。表1补充词典情感极性词汇权值积极负责、帮忙、喜欢、推荐、周到、提示、开心、放心、1保障、照顾、热情、细心、安全、热心、礼貌、认真、优美、温暖、到位、不错、方便、干净、便利、齐全、贴心、舒服、很棒、整洁、挺好、很赞、耐心、温馨、安静、舒适、很好、流畅、舒心、亲切、繁华、好好、免费、超赞、愉快、方便、值得推荐
16、、便宜、宽、漂亮、细致、好评、良好、超好、稳定消极噪音、希望、不能、改善、完善、不知道、提高、-1不行、无语、投诉、有待、加强、吵死、醒、吵架、吵闹、改进、毫无、未解决、敷衍、失望、太差、垃圾、影响、极差、漏水、麻烦、蟑螂、涨价、异味、扰民、差劲、断电、恶心、味道、宠物、差评、离谱、一般、严重、坏的、太低、恶劣、极大、较差、陈旧、太慢、巨大、贵、小虫子、杀熟(2)修饰词构建。参照知网HowNet的否定词和副词词典构建修饰词词典,将副词根据修饰极性的不同划分为5 个等级,并参照前人研究将不同等级赋予相应权值,根据所挖掘的评论语料提取副词词性,得到本文所采用的修饰词,如表2 所示。表2 修饰词程度
17、词汇权值轻度不太、不怎么、不甚、没怎么、轻度0.25低度怪、还、略、蛮、稍、稍微、挺、些、一些、有点0.50中度多、更、更加、还、还要、较、较为、进一步、那1.25么、那样、强、愈发、越来越、这样、足高度惨、多多、好不、很、良、甚、实在、太、特、特1.50别、尤其、远、着实极度备至、不堪、非常、极、极度、极其、绝、奇、十分、2.00死、痛、透、完全、无比、要死、异常、贼、最否定词大不、没、无、非、莫、弗、母、勿、未、否、别、-1無、休、不曾、未必、没有、不要、难以、未曾、不是、不够、不会、不怎么、不太、不能、不是很、不算、不如、不是太、不想、不大、不敢、不要太、不容易、并不、不很、没有那么、不
18、会太、不是一般的、不是蛮、没那么、无法、不算太1.2集中式长租公寓租客需求维度提取1.2.1选取特征词本文使用 TF-IDF算法辅助选取用于需求维度聚类的特征词。TF-IDF算法是一种统计方法,其值的大小用以评估一个词语对文档的重要程度,被广泛应用于特征项选择和领域词典的构建等。其核心思想为一个词语如果在单个文档中出现的频率越高,在语料库包含的所有文档中出现的频率越低,则越能代表该文档的内容属性,该词语在作为特征词选取时应该被赋予较高的权重。其计算式如下:NDTF-IDFxlog(1)Nk.jj:t,ed+1式中,Nk,指词语t在文档d,中出现的次数;Z,Nk.j指语料库中所有的词语数量总和;
19、D指语料库中所有文档的总数;li:tEd指包含词语ti的文档数量。1.2.2词向量训练Word2Vec是Google在2 0 13开发的用于训练词向量的工具 16 ,主要通过词语与上下文的关系,将词语转化为能够表征词义特征的向量化形式。其基于深度学习的思想,通过训练将词语映射成N维实数向量,通过计算词语在向量空间中的距离,来判断它们在语义上的相似度。本文主要通过Word2Vec训练模型输出特征词的词向量,用于词语聚类分析,以提取租客的需求维度。词向量属于密集型科学范式,在大规模语料的条件下训练效果良好 17 。同时,LaiS等 18 研究表明,文本语料的领域性越一致,词向量的训练越准确。长租公
20、寓与短租酒店同属于租住领域,为提高词向量训练的准确性,本文将引人谭松波的酒店评论语料共同组成Word2Vec模型训练语料库,选用跳字模型进行词向量的训练,构建特征词到向量的映射。1.2.3确定需求维度基于Word2Vec模型得到各特征词的词向量后,通过基于K-means聚类算法确定词语最优聚类划分数量,进而根据词语聚类情况确定集中式长租公寓租客需求维度。K-means算法是一种基于划分的聚类算法,同时也是无监督算法,因其效率高、易实现、原理简单而被广泛应用。但是K-means算法存在对初始聚类敏感和易陷人局部最优解两大缺陷,使得聚类结果具有不稳定性 19 。为降低K-means算法初始聚类中心
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 在线 评论 集中 式长租 公寓 租客 需求 研究 魔方
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。