基于机器学习的商业运营管理研究与实现_刘雨昀.pdf
《基于机器学习的商业运营管理研究与实现_刘雨昀.pdf》由会员分享,可在线阅读,更多相关《基于机器学习的商业运营管理研究与实现_刘雨昀.pdf(6页珍藏版)》请在咨信网上搜索。
1、第 31 卷 第 4 期 2023 年 8 月Vol.31 No.4Aug.2023电脑与信息技术Computer and Information Technology文章编号:1005-1228(2023)04-0097-06收稿日期:2022-08-23作者简介:刘雨昀(2000-),女,云南省玉溪人,本科,软件工程专业,主要研究方向:机器学习。1基本概述随着科学技术的发展,各个行业、各个领域逐渐形成智能化管理的趋势,以此来优化其他的业务,增强自身的商业竞争力。疫情三年,重置了中国商业的基本面,据赢商大数据统计,2022 年 1-4 月场日均总客流量仅 12861 人次,同比 2021 年
2、下降 19%,商场作为线下服务为主的实体商业,在“适者生存”规则下,企业需要加速转向精细化运营1。当下的商业市场主要由分散建设的交易机构群体组成,每天都在生成各式各样的交易数据,这些数据是散乱分布的,传统的行业专家只能根据经验或估算提出决策建议,且因数据过大,难免带着先入为主的观点得到似是而非的结论。依据数据的实时性、海量化等特点,依托大量样本数据的商业数据分析工作,是未来商业模式的改革趋势。如何利用已有的商业数据帮助企业深度挖掘消费者新的消费需求,以保证企业在消费市场逐步回暖中领跑下半场成为我们在商业研究领域的一项新挑战。目前,基于机器学习2对海量数据进行分析的方式,能够有效的帮助商圈的各个
3、商家优化服务、挖掘客户需求、提升服务效率,以获得当下最大的经济基于机器学习的商业运营管理研究与实现刘雨昀(北华航天工业学院计算机学院 河北 廊坊 065000)摘要:我国现代计算机技术日新月异,商业智能运营建设取得了空前发展,机器学习理论体系大量融合到现代的科技商业中,使得商业的精准化管理有飞跃性发展。文章旨在研究商业智能运营的分析方法及决策提取。文章以某商场 2019 年第二季度的部分销售数据为例,建立数据的聚类模型并对其进行关联规则分析,并提取决策信息。文章提出的基于 K-means 的聚类模型分别从客户和商铺的角度出发,更加充分的挖掘数据中的有效信息,将复杂繁琐的商业数据生成管理商业的决
4、策建议,为商业提供更加精准的运营决策。关键词:商业精准运营;机器学习聚类;PCA 降维;K-means;关联规则中图分类号:TP311.5,F830.33文献标识码:AResearch and Implementation of Business Operation Management Based on Machine LearningLIU Yu-yun(College of Computer Science,North China Institute of Aerospace Engineering,Langfang 065000,China)Abstract:The progress
5、of modern computer technology in our country is very fast,the construction of intelligent commercial operation has achieved unprecedented development.A large number of machine learning theoretical systems have been integrated into modern technology and business,which makes the precise management of
6、business develop rapidly.In this paper,we aims to study the analysis and decision making of intelligent commercial operations.By taking part of the sales data of a shopping mall in the second quarter of 2019 as an example,we build a clustering model and perform association rule analysis on it,then w
7、e extract decision information via the analysis.The K-means-based clustering model proposed in this paper starts from the perspective of the customers and shops,respectively.This model can find valid information from the data,and generate complex and tedious business data to decision advises.Thus,ou
8、r model provides more precise operational strategies.Key words:commercial precision operation;machine learning clustering;PCA dimensional reduction;K-means;association rule analysisDOI:10.19414/ki.1005-1228.2023.04.003电脑与信息技术 2023 年 8 月98效益。如何高效的使用机器学习完成上述目标是当下研究的必要趋势。本文的主要贡献如下:(1)通过 ETL 在海量数据中筛选出聚类
9、的特征指标,再利用 PCA 降低特征维度,在保留了大量必要的商业信息数据的同时还减少了数据量,降低后续数据建模和算法分析的时间复杂度。(2)通过 K-means 聚类算法从客户和店铺两个维度提出商业决策建议,既结合商业自身的营销数据又综合考虑了面向顾客的消费需求,通过对聚类结果的详细分析,有效的将海量数据转化成合理的营销决策建议。(3)通过 Apriori 算法对客户的消费行为进行关联规则分析,能够得到客户消费行为与店铺之间的强关联关系,最终提供给店铺揽客、留客等方面营销决策。2基于 K-means 的商场管理聚类分析方法现代化经济商圈运作11分为机会分析、店铺目标和策略制定和客户关系管理三大
10、阶段,不同阶段需要结合商圈不同形态的下的消费者特征、经济情况、店铺运维特征、劳动力保障、法规等进行综合分析,通过收集和整理多样化的数据信息,划分管理规则,分析客户行为信息,从而为商圈运作提供决策支持。商圈运作分析的主要目的是帮助企业制定开拓市场目标、有效进行市场竞争、开展精准营销,通过挖掘分析各类店铺和客户的信息,为企业管理提供决策建议。企业在收集数据的同时也会受到决策本身的反馈影响。文章的研究主要从客户和店铺的角度为商圈运作提供理论上的营销策划依据文章中的商场管理分析基于 K-means 聚类模型对数据进行挖掘,建立管理决策的模型。所谓的聚类,就是将样本划分为由类似对象组成的多个类的过程。聚
11、类后,我们可以更加准确的在每个类中单独使用统计模型进行估计、分析或预测,也可以探究不同类之间的相关性和主要差异。由此建立店铺-客户商场管理模型。商圈数据随着不同时间的商业情况,会导致商场的数据密度不同,在常用的聚类分算法中,基于密度的数据聚类算法显然不适用于可变密度数据集,故本文采用基于中心体集群的聚类算法。本文采用的数据及主要包含了商圈用户消费记录及商铺信息。该数据记录了从 4 月到 6 月所用用户的消费记录,共 58590 条。每条记录表示用户的一笔消费,字段信息见表 1:经过数据清洗、删除噪声数据等操作提升数据质量,可对此数据进行进一步的操作。2.1基于 K-means 店铺的聚类分析方
12、法时间数据需要先经过预处理将划分为周中数据和周末数据两类,预处理后从数据集中提取了平均每周周中交易额(weekdays_amountperweek,记为 Da、平 均 每 周 周 末 交 易 额(weekends_amountperweek,记 为 Ea)、平 均 每 周 周 中 交 易 次 数(weekdays_countperweek,$记为 Dc)、平均每周周末交易次数(weekends_countperweek,记为 Ec)、平均每周周中客单价(weekdays_personal_amount,记为 Dp)、平均每周周末客单价(weekends_personal_amount,记为 E
13、p)六个特征数据组成店铺分类的数据集,求出每个特征的均值,有:=niiiizna1)6,1(1(1)其中,ai表示特征均值,n 表示特征样本总数(本数据集中 n 取值为 58590),zi代表一个特征。数据减去均值后为 X=z1-a1,z2-a2,z58590-a58590,再求取协方差矩阵、特征值以及对应的特征向量,标准化以后选择两个较大的特征值对应的特征向量C(c1i,c2i)即可。随机初始化 K 个由六个参数数据对应的向量作为质心,将降维后的特征向量组成二维向量,将样本向量 F 代入公式(2)(2)计算对应的欧氏距离Fi=(c1i,c2i),i (1,n)(3)其中,n 表示特征训练集数
14、量,在文中 n=2.计算出两个空间点的欧式距离,从而将这些向量所对应的数据点分配到 K 个质心去。计算每个质心里所有样本的平均距离中心,寻找最靠近均值点更新聚类中心。计算机聚类评价指标 SC,针对单个样本的轮廓系数 s,定义如下:第 31 卷 第 4 期99刘雨昀,基于机器学习的商业运营管理研究与实现(4)其中,a 表示某个样本与其所在簇内其他样本的平均距离,b 表示某个样本与其他簇样本的平均距离。所有样本的 s(i)的均值称为聚类结果的轮廓系数SC,轮廓系数 SC 的取值范围为-1,1,取值越接近 1则越说明聚类效果越好,相反越接近-1 则说明聚类效果越差,0 表示有簇重叠。可以作为聚类是否
15、合理、有效的度量,计算公式如下:(5)其中,N 表示样本总数。基于 K-means 聚类的店铺聚类分析流程如图 1所示:图 1 基于 K-means 聚类的店铺聚类分析流程图2.2基于 K-means 客户聚类分析方法时间数据需要先经过预处理将划分为上午交易数据和下午交易数据两类,预处理后从数据集中提取了每周平均人午交易次数(amperweek,记为 Aw)、每周人均下午交易次数(pmperweek,记为 Pw)、每周人均交易额(amountperweek,记为 Ap)、每周人均交易次数(countperweek,记为 Cp)四个特征数据组成客户分类的数据集,与基于 K-means 聚类的店铺
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 商业 运营 管理 研究 实现 刘雨昀
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。