Re: [情报] WAR, a case study: Fielder vs. Ryan

楼主: nickyang (肌腱炎者少打字)   2013-03-02 02:10:46
※ 引述《abc12812 ()》之铭言:
:
: 推 julians:我很好奇的是说,如果是这样的话,那我们摆九个Ryan跟摆 03/01 12:58
: → julians:九个Fielder最后得到的胜场会不会差不多呢? 03/01 12:59
:
: 理论上是这样没错
:
: Ryan的打击在一垒会很悲剧 但同样的Fielder当游击霸的守备肯定也很悲剧
:
: 推 Guillen:不会,因为Ryan移去一垒的话WAR会大降,可能会变成负的。 03/01 13:00
:
: 理论上不会变 因为Ryan照理说会比"守备好的一垒手"再更多拦到很多球
: (可以想像一下Pujols和Ryan的范围差距)
:
: 这些多拦到的球抵消掉转一垒的position adjust (约15分)
:
:
: 不过实际上没人这样玩过 所以无法验证
其实相反,我觉得理论上不会这样
wOBA也好、TZ、ZR、WAR也好,所有的关键都在runs created/saved上
runs created/saved最后是连到理论胜率上
这当中的桥梁都是回归分析,回归分析取是大数,不是极端值
任何时候你也只能应用这些数字在大样本、接近平均值的样本
例如说,一支一垒安打长期而言等于0.17分
但是在Barry Bonds前面的一垒安打是不是0.17分?
很显然不是,因为Bonds就是个离群值
一样的道理,positional adjustment SS +7.5、 1B -10都是大数取样
你把很显然的离群值摆进去还能用这个数字推论吗?可能可以,但是要很小心
打个比方,假设今天你用一个价钱区间在$100~$200的东西推算价格弹性
那么能不能计算你把他涨价涨到$1000时的销售量?
不管你在$100~$200之间用的是哪一种curve,out of sample的数字理论上都是没根据的
甚至极端一点,任何没有出现过的price point都是没根据的,即使within sample range
我们信赖现在wOBA乃至WAR的理由是他们的计算结果极为接近真实情况
(全队的wOBA、SIERA推论全队得失分准确,全队得失分推论全队胜率准确)
但前提是多数球队都在你的sample pool里面玩,没有人疯到把肥王子丢到SS
当我们今天要讨论肥王子这个个案的时候,守位校正已经失准了
事实上,任何的个案都存在这种情况,例如说拿FIP看全盛时期的大数准不准?
FIP可能对99%的球员都准,但偏偏对他就很可能不准
SIERA对他可能稍准一点,但同样的,因为他是个很例外的投手,你拿根据多数投手计算
出来的加权套在他身上误差就会偏高
: 推 julians:然后,如果Fielder移到游击去WAR不也会因此大降呢? 03/01 13:12
: → pujos:胖王子去守游击WAR可能会升.而且机率不是一般的大*-* 03/01 13:14
:
: 理论上也是不会变
:
: Fielder当游击霸的防守恐怕不是普通的惨烈
:
: → pujos:守备要扣到比在1b惨有可能吗xdd 03/01 13:17
: → pujos:只要不是连一垒都传不了.范围小就小了 03/01 13:18
:
: 游击手比较的对象 最烂的是至少很会跳传的Jeter
:
: 虽然没人实验过 但Fielder当游击真的很可能一个反手就是内安
:
: 这样看来还有人会觉得转职WAR就会自动加分吗?
另外一个问题是WAR的假设,对的根据WAR的假设你说的没错
但是WAR的假设符合这个case吗?恐怕不是
WAR假设所有的守位可以透过平均校正,这个校正本身忽略了很多因素
例如说假设有个人正手接超强反手接超烂,他站在左边或右边差异就很大
但这个校正的假设是不管你换到哪个位置你的守备能力都不会变
再来,守备位置有没有可能影响打击表现?
WAR的假设是没有,很多球界的人相信有,我们不知道有没有,或说有多大
:
: 推 hunterqiji:任凭WAR再怎么合理﹐真正付钱的老板和GM还是不认的 03/01 13:19
: → hunterqiji:一个简单的问题﹐Ryan能签到20M/y的合约吗? 03/01 13:19
市场效率是一件事,硬球之前有篇文章谈守备职人是不是衰退比较快
那篇文章怀疑是的。
所以Bourn签不到符合WAR的大约、Ryan甚至连张普通约都可能拿不到
也许反映的不是市场效率不彰,是球团的人远比你以为的聪明
:
: 推 TaiwanNeko:守备组薪水比不上重砲手的另一个原因,球迷喜欢打击大 03/01 21:56
: → TaiwanNeko:爆发胜过稳定的守备,球迷多自然赚的多 03/01 21:57
这话不是没有道理,但关系可能没那么强
得分跟全垒打占票房的比重的确高过失分,但是战绩跟球场才是最重要的
: 推 blue142857:问题是一垒手根本不可能cover"大部分"右半边内野 03/01 22:56
: → maxspeed150:你怎么知道不可能? 03/01 22:57
: → blue142857:一垒手在多数的情况下还是会回到垒包而非出去抢球 03/01 22:57
: → maxspeed150:这些守位分数可不是乱加乱扣的 03/01 22:57
不是乱加乱扣,但是没办法处理极端值
另外blue142857说的也是很有可能,两个活动力一样的一垒手跟三垒手
假设他们正反手接球都一样好,他们的站位会一样吗?
很可能不会,站三垒他可以站得很靠二垒,但是站一垒他必须要回去接球
这样的差别可能只在一个人活动力大到可以站在二三垒中间依旧cover三垒时才出现
大部分的情况下不会有这样的一三垒手,但是Ryan会不会是?我们不知道
: 你给Fielder守1B他当然捡不到几球 但Pujols就不同了
:
: 可是Pujols的范围又跟Ryan有差
:
: 可以想像一下Ryan如果守1B会是多神的防守者
事实上我觉得Ryan越神这个差距就越无法预测
他越是out of sample,我们越不知道会发生什么事
: → maxspeed150:备就是一个惨烈 03/01 23:13
: → maxspeed150:就是因为1B从来就不会有很多很多球可以守才有守备扣分 03/01 23:13
: → maxspeed150:在看WAR时请把那些理所当然的直觉丢掉 一切让统计数据 03/01 23:14
: → maxspeed150:说话 03/01 23:14
这样讲我觉得就有点太过,任何的统计都假设,你要很清楚这些假设才能正确的让数字
说话。当这个数字出来违反你的常识的时候,除了怀疑常识是否正确也要怀疑假设是否
还适用
: → maxspeed150:WAR这东西就是为了要更客观评价球员才发明的 03/01 23:57
: 推 blue142857:WAR是个客观评价的标准这我同意 但个人认为他的缺陷在 03/01 23:58
: → blue142857:其实也不算缺陷啦..反正就是他是用统一修正的数据 03/01 23:59
: → blue142857:所以对每个队伍而言 同样把一个球员WAR提升2.0 03/01 23:59
: → blue142857:可能会因为队伍组成而带来不同的效益 03/02 00:00
其实与其说是为了客观评价,不如说是为了简化理解
你对.3/.4/.5没概念,换成几胜总有概念了吧?
但问题就在,WAR是透过层层回归计算的结果,每一次的计算都有假设
有越多的假设运用的限制就越多
这是不是缺陷?我觉得这不算是缺陷,重点是你要理解你模型的假设跟限制
: 推 OoyaoO:如果规则改成多守下一分对方球队得分会减1 多守跟多打一分 03/02 00:49
: → OoyaoO:的价值才会相等吧 03/02 00:49
: → OoyaoO:多守了3分被尻阳春HR但是打不下分最后还是会0:1输球 不会 03/02 00:51
: → OoyaoO:变成0:-2赢球 03/02 00:51
你这样的理解就跟WAR的应用不同了,
打出一支一垒安打不会马上帮你在计分板放上0.17分,但是长期来说会往这个方向回归
一场比赛0:1输球还是2:0赢球从来都不会是统计的重点
统计处理的是长期,是一整季是一个世代,一场球的输赢表现是没办法用任何数字预测的
: 推 waijr:一些统计方法都会有极端值 一般来说都是拿掉 有必要钻牛角尖 03/02 01:01
: 推 prereality:要找出war的弊端我觉得很容易 假设你找了8个在各防守 03/02 01:12
: → prereality:位置都是顶尖war但是攻击指数平均只有6~7左右的野手组 03/02 01:12
: → prereality:成一队应该就会发现问题出在哪了 03/02 01:14
: → prereality:但所谓这种找出8个极端的球员组在一队并且让他们打满 03/02 01:17
: 推 OoyaoO:不可能 没人会去做这种看起来就死定而且高成本的实验 03/02 01:18
: → prereality:整个球季这种事情现实中几乎不可能发生 所以很难去反驳 03/02 01:19
: 推 catsondbs:现实中防守打击以外的变量也很多 投手+守备也不能控制 03/02 01:27
作者: sitos (麥子)   2013-03-02 02:15:00
作者: oralboralb ( )   2013-03-02 02:20:00
好文
作者: catsondbs (猫仔)   2013-03-02 03:06:00
推推 这篇即使没有什么数字也好想推数学去死 orz
作者: asd831129 (SBP)   2013-03-02 03:46:00
简单来说 不该用9个Ryan对上9个小王子这样比较
作者: onime0704 (おにめ)   2013-03-02 03:55:00
推!
作者: Guillen   2013-03-02 04:01:00
作者: knoxvillt   2013-03-02 04:32:00
大推 这篇帮到我理解很多东西
作者: genie2 (新挑战)   2013-03-02 04:39:00
推,说得很清楚又仔细
作者: lolity   2013-03-02 05:39:00
作者: blue142857 (没理由这么棒)   2013-03-02 06:08:00
深夜好文
作者: m16a117 (飞阿~零式战斗机~)   2013-03-02 08:29:00
作者: x147159357 (Solomon)   2013-03-02 08:36:00
好文大推!!
作者: jhoc (jhoc)   2013-03-02 09:53:00
作者: immortalqq (大牛)   2013-03-02 10:05:00
感谢学长好文
作者: Sunrise2516 (XC)   2013-03-02 10:19:00
作者: away01231259 (风)   2013-03-02 10:30:00
作者: hardway (但它也可能是我们的缘分)   2013-03-02 10:40:00
深入浅出啊
作者: catsondbs (猫仔)   2013-03-02 10:46:00
早上再来看一次 WAR守位修正应该也是基于replacement level的概念对吗?
作者: catsondbs (猫仔)   2013-03-02 11:09:00
....脑残了 WAR本来就是说 replacement level
作者: julians (哞哞)   2013-03-02 11:18:00
感谢大大好文
作者: azlbf (上邪!我欲與君相知)   2013-03-02 11:45:00
关于守位影响打击 其实是有的 其实守备很消耗体力跟精神
作者: azlbf (上邪!我欲與君相知)   2013-03-02 11:46:00
但是你说Ry去打DH打击成绩会好很多吗? 这也未必
作者: azlbf (上邪!我欲與君相知)   2013-03-02 11:47:00
只能说专心打击的DH有更多时间去调整自己的下一个打击也有更多的时间休息以及观察投手
作者: sft005 (WTF)   2013-03-02 12:10:00
总是有很多人认为数据统计要反映在每"一场"比赛 Orz
作者: sft005 (WTF)   2013-03-02 12:11:00
我真的希望大多数人可以花一点小时间来看看这篇文章
作者: maxspeed150 (听说茉夏分手了)   2013-03-02 12:44:00
但是彭政闵前几年也说如果上场守备比较不会胡思乱想打击状态反而比较好 当然这类讨论已经超脱数据能说的
作者: lwifbf (耍冰小白)   2013-03-02 15:07:00
专业好文
作者: Sheffield3 (霸气王牌陈鸿文)   2013-03-02 15:18:00
push
作者: kenkenken31 (呆呆傻蛋)   2013-03-02 16:42:00
推~ 好文
作者: Sechslee (キタ━━(゚∀゚)━━!!)   2013-03-02 17:29:00
作者: TheVerve (TheVerve)   2013-03-02 20:07:00
推好闻
作者: Yukirin (いい天気!)   2013-03-02 21:42:00
推 最后一段尤其好
作者: aftermathx (cj)   2013-03-03 00:00:00
看好几遍才看懂原来"大数"是指"大树"
作者: gghh (GH)   2013-03-03 05:34:00
推!好多引战哥都肿了
楼主: nickyang (肌腱炎者少打字)   2013-03-03 08:01:00
没有什么肿不肿,有想法敢讨论比推废话强一万倍
作者: Ruri (星野琉璃)   2013-03-03 09:23:00
意思是说,不该存在九人都是胖王子这种假设来比吗?
楼主: nickyang (肌腱炎者少打字)   2013-03-03 12:14:00
该说像他守这么烂的是无法预测的
作者: maxspeed150 (听说茉夏分手了)   2013-03-03 12:40:00
我推断时是没想到极端值的问题.......
作者: abc12812   2013-03-03 13:14:00
position adjust是拿有多重守位的球员做计算 这样有个盲
作者: abc12812   2013-03-03 13:15:00
点是会玩大风吹的大多是有SS底的工具人 所以计算起来SS => 1B的价值估计比较准 1B => SS的估计容易失真
作者: abc12812   2013-03-03 13:16:00
回到Ryan/Fielder的问题 如果调换守位 我会猜Ryan 1B
作者: abc12812   2013-03-03 13:17:00
会比较接近估计值(~15R) Fielder SS 会比较偏离估计值9 Ryan 推测起来应该会比 9 Fielder强
作者: tckenny1   2013-03-03 16:16:00
好文推
作者: hakkacandy (...)   2013-03-03 21:19:00
推这篇!真的是"深入浅出"
作者: b2209187   2013-03-03 23:19:00
推好文章!
作者: gghh (GH)   2013-03-04 09:16:00
如果所谓“想法”只是拿着“数据”乱用,那比推废文还可怕
作者: gghh (GH)   2013-03-04 09:17:00
偏偏有些假数据派就是拿着鸡毛当令剑鬼扯
作者: gghh (GH)   2013-03-04 09:18:00
这点在当年大树哥当红时特别明显
作者: gghh (GH)   2013-03-04 09:19:00
如果一昧敌视中文报导无论良窳是CCR,那把数据乱用鬼扯
作者: gghh (GH)   2013-03-04 09:21:00
其实跟被鄙视的堕落媒体没两样
作者: gghh (GH)   2013-03-04 09:22:00
而本篇提到的很多观念其实只是计量、统计的基础观念
作者: gghh (GH)   2013-03-04 09:30:00
不是说不能犯这种基础错误,但本版长期以来的风气,嘿,
作者: gghh (GH)   2013-03-04 09:32:00
或许是比较支持容忍这种问题吧

Links booklink

Contact Us: admin [ a t ] ucptt.com