Re: [讨论] DIP, LOB%, shift

楼主: kylechen (kyle)   2015-06-06 15:35:43
这几天听了N大的开示 小弟有如重获新生
整个棒球统计观也因此而有了很大的改变
小弟回去作了一些资料整理 不才只能得到唯一一个结论:
N大实在是太先进了 不要说上太空杀猪公 根本是已经进入异次元
即便在棒球统计圣地美国 像N大这样的人物 是一个也找不出来
我这么说是有凭有据的:
比如说这个叫Glenn DuPaul的人写了篇文章提到了这段:
http://goo.gl/eksWVP
There’s a group of statistics in the sabermetric community known as “
ERA-estimators,” These statistics are based on outcomes that are more under
a pitcher’s control (strikeouts, walks, groundballs, home runs), typically
known as peripherals. They attempt to forecast where a pitcher’s ERA is
going to move in the future.
The most common ERA estimators currently are fielding independent pitching
(FIP), expected fielding independent pitching (xFIP) , skill-intereactive ERA
(SIERA) and true ERA (tERA).
有一类统计数据叫做"ERA-estimators" 广为棒球数据分析社群所知
........(中间不重要的省略不翻译 小弟英文太差).............
..这类统计数据尝试着预测一个投手未来的ERA
目前最常见的ERA estimators 是FIP, xFIP, SIERA, 还有tERA
一个人无知乱写也就算了 有一个叫做Tom Tango的美国乡民
竟然还敢出来声援这篇文章:
By Tangotiger:
A great piece of research by Glenn. They key table is the second one.
http://goo.gl/g8pedm
比对N大的开示:
"不明所以的人看到FIP每年根据联盟平均ERA做校正,
很容易误以为FIP 是用来预测ERA
全错。"
"FIP根本不可能是用来预测ERA的"
"不但预测的效果是没有意义的 预测ERA 本身都是没有意义的"
"那为什么FIP要根据联盟ERA校正呢?那只是因为大家已经习惯了ERA,
所以把FIP转换成一个跟ERA 范围差不多的数据,让多数人比较容易阅读。"
超越了发明者Tango大的思维 直言不讳的训示FIP的真正意涵
同时显现出对普罗大众的慈悲与怜悯 神人毕竟跟凡人不同
不过小弟是个凡人 资质大概只能停留在杀猪公的阶段
更没有N大所说的 "预测ERA没意义" 这样超然的胸襟
这点所有mlb球团的数据分析部门都要自叹不如
在这边跟大家分享一下观察美国猪公杀手的心得:
其实在美国 利用各种数据分析方法 试图预估投手未来的ERA
是评估投手的热门话题之一 大家都在比较谁的方法较准
原因无他 只因为失分多少是球队最关心的事情
就像一个大师说的(忘了是谁了 别鞭我):
"对我而言这世界上只有两种好投手
一种是能够帮助球队减少失分的
另一种是名字叫做Kyle Farnsworth的"
的确 RA/9 才是失分 但几乎大家都是预估ERA
理由是什么 我没有依据不敢乱说
的确 因为运气关系 常常会预测不准
但是预测不准不代表就不用预测
只要该结果确实是有实质上的帮助 (比如说签新投手)
就有继续研究的价值
就像我们目前的地震预测系统 可以说不准到了极点
但依然还是有部分学者投入在这方面 试图找出更好的方法来预测地震
预估投手未来的ERA 除了前面提到的ERA-estimators
还有另一派别是Projection Systems 一样有许多种
(连Tango 大大也作了一个叫Marcel的) 以下的网页有一些介绍
http://goo.gl/enJBNx
两派的主要差异在 Projection Systems通常较复杂 但功能也较多
投手部分除了ERA还能作其他预测
并且包含预测打者的部份
广义的来说 任何东西都能拿来预测未来的ERA
但准不准则是另一回事
这篇文章让一些ERA-estimators 跟Projection Systems作了大乱斗
http://goo.gl/K4lPF0
这已经是三年前的文章了
现在应该又出了许多其他新指标
提出这篇文章有一个理由
里面的结果显示FIP在各种预测表现上 效果都是倒数的
仅比用现在的ERA来预测未来的ERA好一点而已
为什么不准的理由 我已经在前面的文章讲很多次 不需重复
所以真的 别再信FIP了
讲到如何判断一个方法/数据
对未来ERA的预测性好不好
有两个关键:
一个是YoY correlation 就是年与年之间的相关系数
显示投手对某件事的相对控制力
也可以看作是"明年再重现这个数据的机会大不大"
其实N大在前面的文章提过这个了 可惜的是 只看这个是不充分的
必须要再看第二件事:
该数据与ERA的相关性
也就是我在前几篇文章所作的 把WHIP与FIP,跟ERA去作回归
这不是我自己发明的 我只是照抄Matt Swartz的方法而已
http://goo.gl/SyMQRl
(Table10, 稍微不一样的是他对park-adjusted ERA作回归)
N大:
"为什么没有人像我们板友一样,这么聪明到拿同一年的各式数据去跟ERA 做回归呢"
"都已经拿着温度计在手上了,还到处收集湿度辐射风速去测量温度,到底是什么样的
天才逻辑呢?"
当然 在N大面前
什么SIERA的发明者Matt Swartz 也只是畜生一个 不算是个人
只是一个傻子在做无意义的事情而已
一样 我辈凡夫俗子若不能达到那样的境界
请听听为什么要这样作的理由:
理由很简单 举个例子 投手对自己的名字有没有控制力?
有嘛! 控制力几乎是百分之百嘛!
假设我们如果用投手的名字来当作预测未来ERA的指标
我们每年都可以完全重现这个指标
问题是投手名字跟我们想要预测的ERA几乎没有相关性
所以预测结果就是一团糟
一个好的预测指标 高重现性 重现后与ERA的相关性 两者一样重要
若比较FIP与WHIP
FIP 有较高重现性 但重现后与ERA的相关性低
WHIP 重现性较低 但重现后与ERA的相关性高
WHIP的重现性较低 其实就是我说的重大缺点
很遗憾的N大没有讨论的意愿
最后也要谢谢N大 每次读到N大的回文 总是充满了惊喜
就好像进入了一个RPG大作一样 比太空战士好玩何止千倍
请容我称之 "尺神幻想曲"
说是大作决不是夸大 比如说
1.DIP没有S语言 媲美克林贡语
2.LOB%线性 突破物理极限 一上垒必得一分理论
3.各种天马行空的游戏内容 粉碎世俗羁绊 各式超越原创者的名词新解
4.好玩的Shift黑魔法阵 彻底影响打者的运气
另外算我求N大了 告诉我你的SABR社群好不好?
一个连预测ERA都认为无意义的乌托邦 无论是谁都想去朝圣一下的
作者: iwillloveyou (darren79525)   2015-06-06 18:26:00
水桶他好吗
作者: fountainNess (秋本平吉千人将)   2015-06-07 11:50:00
故意曲解

Links booklink

Contact Us: admin [ a t ] ucptt.com