基于因子分析的NBA球队实力研究_李越.pdf
《基于因子分析的NBA球队实力研究_李越.pdf》由会员分享,可在线阅读,更多相关《基于因子分析的NBA球队实力研究_李越.pdf(6页珍藏版)》请在咨信网上搜索。
1、2023.7电脑编程技巧与维护1概述对NBA球队进行实力研究既可以为分析比赛提供科学依据,也可以为提高国内篮球联赛水平提供参考。如今,NBA给出了许多细粒度的评价指标1。随着统计数据的精进,对球队实力的评价也更加全面。李林杰和张学东2应用logistic模型分析影响比赛胜负的因素;刘狄3运用因子分析和聚类分析得出得分、篮板、抢断能力因子是决定球队成绩的主要因素的结论;牛兆捷4通过贝叶斯算法分析了得分状态与进攻之间的关系;徐雪娇等5基于层次分析法进行球队实力研究。2理论方法2.1因子分析模型因子分析是多元统计分析中的一种降维方法,研究原始变量相关阵或协方差阵的内部依赖关系,它将多个变量综合为少数
2、因子,再现原始变量与因子之间的关系。目前因子分析在心理学、社会学、经济学等学科的应用都取得成功。假设可观测随机向量x=(x1,x2,xp),不失一般性;E(x)=0,COV(x)=;不可观测随机向量f=(f1,f2,fm),E(f)=0,COV(f)=Im,且mp。=(1,2,p),与f互不相关,E()=0,COV()=diag(12,p2),正交因子模型如公式(1)所示:(1)其中,f为公共因子;为特殊因子或误差;aij为第i个随机变量在第j个公共因子上的载荷。需要注意:一个统计量即因子载荷矩阵A的各列元素的平方和为该公共因子对原始变量的方差贡献,用于衡量该公共因子的重要性。对于载荷矩阵和剩
3、余方差矩阵的参数估计方法有主成分法、主因子解法、极大似然法3种,其中主成分法应用较广泛,即采用主成分法进行参数估计。2.2因子旋转理论因子分析的目的不仅是求出公共因子,还是知道每个公共因子的实际意义。由以上参数估计方法所求出的公因子解,其初始因子载荷矩阵并不满足“简单结构准则”,即各公共因子的典型代表变量不很突出,因而容易使公共因子的实际意义含糊不清,不利于对因子进行解释。为此必须对因子载荷矩阵实行旋转变换,使各因子载荷矩阵的每列元素的平方按列向0或1两极转化,达到其结构简化的目的。已经提出的因子旋转方法很多,在此采用实践中最常用的方差大的正交旋转,其思想是使载荷矩阵的每列元素的平方方差达到最
4、大并作为载荷矩阵结构简化的准则。2.3因子得分有时要求把公共因子表示为变量的线性组合,或反过来对每个样品计算公共因子的估计值,即所谓的因子得分。因子得分可用于模型的诊断,也可作为进一步分析的原始数据。但因子得分的计算并不是通常意义上的参数估计,而是对不可观测的随机向量的估计。因子得分的估计方法主要有加权最小二乘法和Thompson回归法两种。从统计上讲,两种因子得分估计方法各有优劣,没有哪种估计方法一直优于另一种方法。加权最小二 乘 法 是 无 偏 的,Thompson回 归 法 是 有 偏 的,但Thompson回归法有较小的均方误差,在此采用Thomp-son回归法。3实证分析3.1数据准
5、备在对明星球员能力进行衡量时,选取各球队得分最作者简介:李越(1998),男,硕士,研究方向为机器学习的应用。基于因子分析的 NBA 球队实力研究李越(东北大学理学院,沈阳110819)摘要:NBA 各球队之间的实力关系是篮球爱好者谈论较多的话题,人们判断球队强弱主要基于主观判断,缺乏科学依据。因此有必要对 NBA 球队进行实力分析和研究。在比较以往研究所选指标和统计方法的优劣后,提出了基于因子分析,构建成对比较矩阵,以球队基础能力、明星球员能力、主教练执教能力为主要影响因素的模型,对 20222023 赛季西部联盟的 NBA 球队进行了实力分析。关键词:NBA 球队实力;因子分析;成对比较矩
6、阵;2022-2023 赛季21DOI:10.16184/prg.2023.07.0322023.7电脑编程技巧与维护成分总计初始特征值方差百分比(%)累积(%)总计提取载荷平方和方差百分比累积(%)总计旋转载荷平方和方差百分比(%)累积(%)15.70347.52347.523 5.70347.52347.523 3.73431.11531.11521.51912.66160.184 1.51912.66160.184 2.44120.34351.45731.37911.49471.678 1.37911.49471.678 2.10217.52068.97741.26910.57782.2
7、55 1.26910.57782.255 1.59313.27882.25550.6455.37887.63260.5344.44892.08070.5174.31296.39280.2131.77398.16590.1130.93899.102100.0630.52499.627110.0300.24999.876120.0150.124100.000提取方法:主成分分析法表1KMO和巴特利特检验多的球员的相应指标(得分、篮板、助攻、抢断等基础数据与真实命中率、进攻效率、防守效率、效率值、胜利贡献值5个高阶指标);在对球队基础能力进行衡量时,选取各球队的投篮命中率、投篮命中数、投篮出手数等指
8、标;在对主教练执教能力进行衡量时,选取主教练执教场数和执教胜率两项指标。3.2明星球员能力球员的得分、篮板、助攻、抢断、封盖、失误、犯规是最常见的基础数据,但仅用这些基础数据不足以评价一个球员的能力。例如,在20052006赛季最有价值选手(MVP)评选的过程中,场均得分18.8分、4.2篮板、10.5助攻的纳什;场均得分31.4分、7.0篮板、6.6助攻的詹姆斯和场均得分26.6分、9.0篮板、2.8助攻的诺维茨基均有当选理由,仅由这些基础数据难以抉择,这时一些高阶数据就可以发挥作用了,例如,进攻效率,效率值等。选择7个基础数据分别为,得分、篮板、助攻、抢断、封盖、失误、犯规;5个高阶数据分
9、别为效率值、真实命中率、胜利贡献值、进攻效率、防守效率综合评判球员能力。其中,5个高阶数据的定义如下:(1)效率值是根据比赛节奏调整后的球员每分钟的表现,数值越大代表能力越强。(2)真实命中率即真实投篮命中率,结合球员两分球,三分球,罚球的表现,用来综合评价球员的命中率。(3)胜利贡献值用于衡量球员对球队胜利的贡献程度,数值越大代表球员对球队的积极影响越大。(4)进攻效率即每100个进攻回合,球员的得分。(5)防守效率即每100个防守回合,对手的得分。对于西部联盟15支球队中的明星球员(选取各队得分最高的球员为明星球员)进行数据的搜集。对收集到的数据进行因子分析。首先,进行凯泽-迈耶-奥尔金(
10、KMO)和巴特利特检验,结果如表1所示。表1中KMO值为0.556,超过0.5。由KMO的意义可知,数据适合做因子分析;巴特利特检验的显著性几乎为0,小于显著性水平0.05,因此拒绝原假设,即说明所分析的变量之间存在相关关系,如果有相关性,则适合做因子分析。同样观察相关性矩阵,发现变量之间存在相关性,如表2所示。通过表3公因子方差可以看出,每个变量的提取值均在0.641.0,说明因子分析是合适的。根据特征根大于1,确定公因子个数,并用最大方差法对载荷矩阵进行旋转,总方差解释如表4所示。由表4看出初始特征值大于1的公因子有4个,且这4个公因子对变量解释的贡献率达到82.255%。其中,公因子1占
11、比31.115%;公因子2占比20.343%;KMO取样适切性量数0.556巴特利特球形度检验近似卡方121.203自由度66显著性0.000篮板 助攻 抢断 盖帽 失误 犯规 得分真实命中率进攻效率防守效率效率值胜利贡献值篮板1.000 0.397 0.094 0.430 0.318 0.015 0.061 0.579 0.489-0.430 0.612 0.564助攻0.397 1.000 0.338 0.069 0.777 0.137 0.478 0.346 0.617-0.305 0.771 0.629抢断0.094 0.338 1.000 0.674 0.322 0.418 0.26
12、5 0.162 0.234-0.372 0.405 0.416盖帽0.430 0.069 0.674 1.000 0.212 0.378 0.267 0.398 0.188-0.507 0.441 0.470失误0.318 0.777 0.322 0.212 1.000 0.181 0.486 0.218 0.269-0.386 0.488 0.296表2相关性矩阵(部分)初始提取篮板1.0000.773助攻1.0000.894抢断1.0000.800盖帽1.0000.895失误1.0000.851犯规1.0000.740得分1.0000.642真实命中率1.0000.855进攻效率1.000
13、0.855防守效率1.0000.743效率值1.0000.933胜利贡献值1.0000.890提取方法:主成分分析法表3公因子方差表4总方差解释222023.7电脑编程技巧与维护公因子3占比17.520%;公因子4占比13.278%。这4个公因子的整体解释效果超过80%,说明因子对变量的解释能力很好。在碎石图中,一颗石头从上面滚下来,取出让石头滚得快的点,即斜率比较大的点,就是该原始变量的公共因子,从图1中可以直观看出,在4个因子后折线变得平缓,这说明提取出的4个公因子效果不错。接下来需要对这4个公因子进行命名。旋转后的成分矩阵如表5所示,各数值即为因子载荷矩阵中的参数,可以看出对于公因子1,
14、最大的值对应的指标为真实命中率、进攻效率、胜利贡献值、效率值等,因此可以把公因子1命名为个人进攻因子;对于公因子2,最大的值对应的指标为助攻、失误、得分,因此可以把公因子2命名为团队影响因子;对于公因子3,最大的值对应的指标为盖帽、抢断、防守效率,因此可以把公因子3命名为个人防守公因子;对于公因子4,最大的值对应的指标为犯规,因此可以把公因子4命名为犯规因子。最终确定的4个公因子分别为个人进攻、团队影响、个人防守和犯规。通过Thompson回归法得出各队明星球员的公因子得分,对这4个公因子得分进行加权求和,权重由其解释变量的方差比例决定(个人进攻占比0.38、团队影响占比0.25、个人防守占比
15、0.21、犯规占比0.16),结果如表6所示。3.3球队基础能力对球队基础能力的研究类似于对明星球员能力的研究。针对NBA数据库中的球队统计指标,选用一些基础统计指标,如投篮命中率、投篮命中数、投篮出手数、三分命中率、三分命中数、三分出手数、罚球命中率、罚球命中数、罚球出手数等和一个高阶统计指标回合数来进行评判,回合数的计算公式如公式(2)所示:回合数=0.96(投篮+失误+0.44罚球-进攻篮板)(2)对于西部联盟的球队进行数据搜集,首先进行KMO和巴特利特检验,发现KMO未大于0.5。通过表7公因子方差可以看出,多数变量的提取值在0.661.0,这也说明了因子分析是合适的。由表8总方差解释
16、看出初始特征值大于1的公因子有4个,且这4个公因子对变量解释的贡献率达到84.389%。其中,公因子1占比为24.995%;公因子2占比为22.004%;公因子3占比为19.441%;公因子4占比为17.950%。4个公因子的整体解释效果超过80%,图1碎石图1成分1234真实命中率0.900进攻效率0.868胜利贡献值0.818效率值0.7830.481篮板0.699失误0.882助攻0.4000.855得分0.6310.426盖帽0.854防守效率-0.734抢断0.6880.505犯规0.821提取方法:主成分分析法旋转方法:凯撒正态化最大方差法a.旋转在24次迭代后已收敛表5旋转后的成
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 因子分析 NBA 球队 实力 研究 李越
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。