Re: [讨论]现役球员谁能进名人堂?

楼主: Yukirin (いい天気!)   2013-12-15 02:26:33
※ 引述《RollingWave (Lost in the Dark)》之铭言:
: 以上这几个中 Nash 应该备这种计算法严重的低估了,光是两个MVP 应该就99% 了
: KD 这种年纪就74% 只要不要出现悲剧应该都没问题的,阿骂这种倒退应该看来是没机
: 会了。 VC / Pau 这两个争议比较大,不过以King 能进,T-Mac 看来也会进的情况下
: 我想他最后也会,Pau 戒指跟圣衣加持机率应该也不错。
: 在这后面大概最有机会的老人应该无疑是Manu, 他国际加分爆表,光是打爆梦幻队这点
: 就加分到爆炸了。 以NBA HOF的实际投票法来推测Manu几乎是100%
看推文一堆批斗,不过批BR算法之前先来搞清楚一下这东西的基础。
http://www.basketball-reference.com/about/hof_prob.html
1. 这是一个典型的分类问题,使用一些指标,将样本来分类,
这边的类别就是"进名人堂"跟"没进"两种,BR使用Logistic Regression,
以过去球员的样本是否进入名人堂,来评估未来的球员进入名人堂的机率。
2. 他们所使用的预测指标一共有七个,身高、时间指标(可忽略)、
场均得分、篮板、助攻、全明星次数、冠军次数。
为什么是这七个,BR没有解释,很明显的可以看出没有考量国际赛加分之类的,
因为很明显的是,过去球员根本没有几个会有国际赛加分这回事,
这怎么会有预测力?
但要以这个来批BR的算法是不切实际的,这是整个球员pool在结构性上的改变,
要得到至少在模型内有意义的结果,很难去考虑这种非常细微的因素。
3. 这七个指标的系数分别是:
身高 -0.1771
时间指标 3.1498
场均得分 0.3433
场均篮板 0.4193
场均助攻 0.3327
明星赛次数 0.5626
冠军次数 0.9151
以Nash跟Bosh为例,两个人都是八次全明星,得分Bosh胜,
篮板跟助攻两人数据几乎是互换,而可以看到助攻其实比较不值钱。
最重要的是热火这两连霸下去自然Bosh占上非常大的优势。
再者,这里使用的是场均数据,Nash在生涯末期、Bosh在当打之年,
场均系列的数据Bosh未来只会下修,看看明星赛跟冠军的累积是否能弥补下去。
而长年得到的累计数据,则没有被考虑到,原因可能与第4点有关。
推文有人说KD现在就有N%了以后应该也会进,
这是没有考虑到这个算法可能favor壮年期球员的现实所造成的误解,
因为这可能会往下降。
4. 传统上都会觉得有拿MVP就是稳进。那为什么BR居然没把MVP次数给放进去?
我的看法是,因为MVP这个指标放进去了,也会被场均数据给"吃掉",
意思是说,拿MVP基本上就是数据好,但是数据好不一定会拿MVP,
而数据好会进名人堂,当把数据好跟MVP这两件事一起评估下去的时候,
会发现数据好的cover范围比较大,MVP这个指标有解释力太小的问题。
5. Nash这两个MVP其实也是前述结构性上改变的一种体现,翻开NBA的MVP得主清单,
Nash跟Bill Russell就是在比谁得分比较低,而综合各种场均表现的WS/48来说,
其实也都还算在后段。
第一年拿MVP的时候,其实没什么异议,当年太阳62胜联盟第一,
而MVP几乎都是投给最佳队伍的老大;
第二年联盟有三支60+胜的球队,而当年在阿骂缺阵的情况下拿下了54胜,
单纯从数据上看不出来有什么改变,但他的价值真正的被凸显出来。
我认为这是NBA在投MVP票选时一个些微的改变,
导致过去他可能会拿不到第二个MVP,但在现在的体系下他拿到了。
那么BR没把MVP当指标放进去是错的吗?只要使用过去的资料推测未来这个信条不变,
他就没什么道理是错的,因为你最多也就只能说,
用过去球员是否进名人堂的资料、无法推测现代球员是否会进,
但一旦连过去资料的价值都推翻,那我们还剩下什么?
  感觉、印象、去猜测这个球员会不会进去吗?
 
BR这套做法,在结构变动的现今看起来不完美,但应该是best we can do.
与其否定这套估计方式的价值,不如就多等等这个新结构的资料开始累积,
看看"光靠国际赛杀爆梦幻队就会进"这种断言是否成真,
然后反过来在修正模型,才是上策。
作者: katanakiller (管他去死)   2013-12-15 03:00:00
少了MVP次数nash才会那么低
作者: michael0728n (蒜˙远古)   2013-12-15 03:13:00
为什么身高可忽略? 因为参数太小吗?!

Links booklink

Contact Us: admin [ a t ] ucptt.com