[讨论] 球员进攻选择跟获得罚球数的相关性

楼主: henry87927 (Sunshine)   2023-05-05 01:45:07
→ ratzeial: 那你要不要顺便看一下场均罚球高的球员出手距离跟罚球,跟你的公式有没
有match?
问得好!
最喜欢这种想要进行学(笔)术(战)交流的朋友了!
我们先不要把范围限缩在场均高罚球次数的球员上,我首先比较好奇的是这个“出手距离跟
获得罚球”的相关性,如果再细分到一个一个球员上,会不会也成立呢?
首先,如果是用所有球员(我们算有出赛超过20场的)例行赛的数据去比较,那会长这样:
https://i.imgur.com/21BoZjf.png
欸怎么变正相关?因为会有一堆低出手数低罚球数的球员堆在左下角那边,整个分析就没意
义了。
所以找出“场均出手多少次以上的球员才是有参考价值的样本”就很重要了。
这边欢迎各位版友提出更好的方法,我自己是用了帕雷托法则(就是鼎鼎大名的80/20法则
)去做假设。
为了让文理组都不得罪,这边解释一下80/20法则。大致上的意思是说80%的结果,都是源自
20% 的成因。
换句话说,小比例的原因就能带来结果带来巨大的影响。比如公司80%的营收大多来自前20%
的客户、国家80%的GDP来自前20%的企业等等。
上NBA版还能学统计学,想不到吧。
回到主题,NBA的出手次数虽然没有集中到80/20,但70/30却是有的。
本季例行赛,NBA官网登录539名球员,全联盟出手了217220次。
而出手次数前30%的球员(前162名)的加总出手数是142926次,占了全NBA的出手数的66%。
所以拿出手次数前30%的球员作为样本,来比较“球员出手距离跟获得罚球数量”的相关性
,应该很有代表意义了吧:
https://i.imgur.com/HeDrGir.png
嗯…还是正相关,我想了一下,发现我忽略了一个简单的事实:
“越常出手的球员,本来就越容易有罚球啊。”
所以我再用这前30%的球员资料比较了场均出手数跟罚球数的关系:
https://i.imgur.com/peXXGwp.png
果然有够相关。
但仔细观察图表之后,发现随着出手次数的增加,资料点开始逐渐发散,尤其以出手数15次
附近为分水岭。
场均出手15次以上的“罚球数跟出手次数”相关性减弱了。代表有其他的变量在影响这个相
关性。
那我们把场均出手15次以上的数据(其实是14.7次以上因为我想把Poole也摆进来XD)拿来
比较,于是就得到了这张图:
https://i.imgur.com/NiJvay2.png
能场均出手14.7次以上,应该可以说是各队主力球员(共58位),大家应该都认得就加了名
字上去。
顺手标了几个大家会感兴趣的球员给大家当吵架素材,请珍惜帐号。
所以分析完数据之后下个结论:
1. 出手次数越多,就越有拿到罚球的机会(废话
2. 球队“主力球员”的攻击选择,则会受到出手距离的影响。出手距离越远,得到的罚球
数越少。
有不少推文有提到相关系数太低的问题,的确这篇拿来当论文应该会被教授洗脸洗到翻过去

与罚球多寡有相关性的变量应该非常多,之后有空的话打算再抓多点数据做多变量分析。
这篇就当抛一个想法给大家讨论,研究方式不严谨请见谅。
也附上这篇跟上一篇回归线公式的比较:
上一篇回归线:
https://i.imgur.com/IjizhdM.png
这一篇回归线:
https://i.imgur.com/TIc7CZx.png
上一篇推文有人说要附上P value证明显著性,好啦都来啦:
https://i.imgur.com/XD5l4jZ.png
最后应你要求,“顺便看一下场均罚球高的球员出手距离跟罚球,跟你的公式有没有match?

我就抓场均最高的10位球员,自己看:
https://i.imgur.com/kLnrWhu.png
商科算文组的话我文理组都待过啦。大家聊球就好。不要乱开战场:)
以上一点小分享,感谢大家。有看到推文说想看太阳46罚的分析,要是最后西决湖人打太阳
我就做XD
数据都这里抓的,有兴趣欢迎各位多多利用[Teams Traditional | Stats | NBA.com](http
s://www.nba.com/stats/teams/traditional?SeasonType=Regular+Season)
作者: badangel0000 (红茶犬)   2023-05-05 05:43:00
简单的事实 本来就不用理那个悲愤宅 超逗
作者: baller0allen (Lo que paso paso..)   2023-05-05 07:18:00
结论就是没有结论,数据太离散我知道basketballstate 可以抓到 出手形态,可以以出手形态为主做分析 可能比出手距离有用还可以加入柴犬的影响(每个柴犬整场比赛吹罚的数量与平均吹罚的偏离正负差)
作者: Dickys200092 (Dickys)   2023-05-05 07:25:00
有解决内生问题给推
作者: skywings1984 (空翼1984)   2023-05-05 08:11:00
认真!专业 !
作者: Presentation (代表)   2023-05-05 08:29:00
你的相关系数0.1太低,表示两个变量是低度线性相关,另外xy的比例差异过大,导致你觉得线画起来很有相关,实际上两个轴的scale拉到一样的话,回归线应该几乎是水平线了这种大学基础统计学的回归章节功课,图跟数据解释成这样,要怎么给推?推文不就说了,结论的正相关(出手距离、罚球数)数据的相关系数只有0.1,表示低度线性相关,至于图为什么看起来正相关是因为xy 轴的scale 差异过大,如果调整scale,图看起来应该会接近水平线,就不会觉得很正相关了我还正好真的是统计硕士呢,已经回复的推文我想不必再争论下去,原po 也已经知道自己的结论过于粗糙,等看看他修正后的文再说吧
作者: gamania11234 (过敏好痛苦)   2023-05-05 12:31:00
嗯,看不懂。有没有大神认真解释一下这篇的名词跟重点QQ
作者: Presentation (代表)   2023-05-05 13:12:00
统计数据图表不是已经说明原po 解释的问题点了,哪里看不懂?

Links booklink

Contact Us: admin [ a t ] ucptt.com