楼主:
gaowolf (銀狼閃光 三日月åŠ)
2019-03-09 21:31:07(知识文长请慎入)
我相信各位应该都会同意
防守的贡献是不好量化的,特别是与进攻端相比之下
而我本篇的讨论文
就是要来讲讲,如何以R统计软件量化球员对球队防守的贡献
没意外今年Kobe(以下简称为老大)与邓肯都会进入名人堂
而他俩的防守第一队皆入选至少八次,因此就挑他们俩为样本
模型如下:
Y=团队逐年防守效率(Drtg)
X=1.队友该年是否获得年度防守球员奖(DPOY)
2.队友中该年DBPM最高的那个值(Teammate)
3.队友该年获得年度防守一队的总次数(T.s.First.D)
4.队友该年获得年度防守二队的总次数(T.s.Second.D)
5.老大该年是否入选年度防守一队(B.s.First.D)
6.老大该年是否入选年度防守二队(B.s.Second.D)
7.老大自己该年的DBPM(Bryant)
解释:
1.5&6是二元变量,也就是有的话记为1,没有的话记为0
2.探讨对象为邓肯时,5&6这两个变量名称会改成D.s.First.D和D.s.Second.D,7则换成D
uncan
3.老大生涯无队友获得DPOY或防守一队,导致2&3这两项变量都会一路挂零
因此他的模型会直接少两个变量
4.同理,邓肯的模型也是没有DPOY这一项
两人的数据列表如下:
邓肯https://i.imgur.com/9U9gWxO.jpg
老大https://i.imgur.com/0kw2XMD.jpg
接着,该进入回归分析结果的部分了:
老大https://i.imgur.com/4ap3vGf.jpg
邓肯https://i.imgur.com/75FSTI3.jpg
统计中,显著的概念表示一个X变量有无实质影响力
而显著是有程度之分的,举例来说,1%会比5%更显著
因此图中的"."与"*"都是在表示显著程度
"."=10%水准下显著 "*"=5%水准下显著 "**"=1%水准下显著
若无任何符号 则代表不显著
我们可以发现
跟邓肯的队友相关之四个变量里面,有两个显著,甚至有一个到达0.1%的显著水准
至于邓肯自己相关的三个变量皆非显著
事实上是离10%显著水准有一大段距离
老大正好相反
他的队友变量仅一个是10%水准显著,程度远逊于邓肯的队友变量
而老大自己的变量有一项是10%显著
结论:
数据显示
邓肯对马刺的防守贡献<<老大对湖人的防守贡献
邓肯队友影响马刺防守的程度>>老大队友影响马刺防守的程度
所以老大在防守端是在罩队友
邓肯则是获得明显更多的防守支援
马刺的团队防守好,邓肯的队友贡献其实不比邓肯少
辛苦程度上老大明显更加艰辛