Re: [外电] 普人震怒

楼主: agga (小孩)   2014-03-08 08:29:45
※ 引述《tlchen (台湾加油)》之铭言:
:   OPS+ 真的能让张飞打岳飞吗?我们来看一个小例子。
:   某甲为十年前某校的毕业生,成绩全校第一名,平均分数为 98 分。
:   当年全校学生平均分数为 70 分。
假设标准差7分, 甲的z分数4分
:   某乙为今年同一所学校的第一名毕业生,平均分数为 90 分。
:   今年全校学生平均分数为 60 分。
若标准差10分, 乙的z分数是3分
甲是比乙好的
棒球员到底要用ops+比还是用z分数比
应该还不知道哪种比较好
标准差的资料也不知道去哪找
:   为了能让甲乙相比,某丙创造了一个 score+,
: 公式是个人成绩除以全校平均再乘 100
: 根据 score+,某乙 150 海放某甲的 140,是个较优秀的学生。
:   发现这样论证的问题了吗?score+ 或 OPS+ 这种东西,
作者: nickyang (肌腱炎者少打字)   2014-03-08 08:38:00
Baseball databank可以download攻击数据都是可以免钱跑的
作者: tlchen (台湾加油)   2014-03-08 11:27:00
若有硕士主修统计的,若刚好有指导老师愿意帮助玩这些资料我相信是很有机会海放目前的棒球统计
作者: OalexO (fight!)   2014-03-08 11:40:00
海放? 楼上真当美国那些数据专家没统计背景吗...
作者: idtvgame (唉低电视游戏)   2014-03-08 11:46:00
台湾就有经济统计硕博士生在写运动相关的论文了...
作者: idtvgame (唉低电视游戏)   2014-03-08 11:47:00
经济学也有运动经济学这块还有期刊 多的是在跑计量的论文
作者: tlchen (台湾加油)   2014-03-08 11:51:00
期刊,研讨会都有,统计界每年的大拜拜,也有运动统计问题是有多少人,多少心力真正投入
作者: tlchen (台湾加油)   2014-03-08 11:53:00
若一开始的人稍微有点统计概念,就不该是OPS+这种观念出现
作者: idtvgame (唉低电视游戏)   2014-03-08 11:59:00
所以这跟你"有硕士主修统计且教授愿意帮助就能海放"
作者: idtvgame (唉低电视游戏)   2014-03-08 12:00:00
你这种讲法好像都没有念经济统计的人在做这块一样~
作者: aborwang (Abor)   2014-03-08 12:13:00
推OalexO
作者: onime0704 (おにめ)   2014-03-08 12:21:00
讲的数据好像只有OPS+一样Orz
作者: TRAP   2014-03-08 12:35:00
海放? XDDDD
作者: maxspeed150 (听说茉夏分手了)   2014-03-08 13:10:00
海放吗............................................
作者: maxspeed150 (听说茉夏分手了)   2014-03-08 13:11:00
只能说 红雀每年付给Tango那么多钱 红袜付给James那么多钱 不是没理由的
作者: maxspeed150 (听说茉夏分手了)   2014-03-08 13:12:00
OPS+甚至更进一步的WAR之类你能在BR或FG查到的数据都是给球迷的小玩具 球队内部的统计工具发展比这复杂多
作者: maxspeed150 (听说茉夏分手了)   2014-03-08 13:18:00
抱歉记错 Tango现在是小熊的人
作者: chordate (封侯事在)   2014-03-08 13:34:00
说海放的真是搞笑,你能海放早就被付钱请去了
作者: chordate (封侯事在)   2014-03-08 13:35:00
OPS+是好算又误差不会太大
作者: chordate (封侯事在)   2014-03-08 13:37:00
真的当Sabermetrics只有这点东西啊?
作者: IAmaMouse (我是一只老鼠)   2014-03-08 14:06:00
原来美国球团都是槌子, 便宜的学校学生不找, 去花大钱买随便都会被海放的垃圾
作者: tlchen (台湾加油)   2014-03-08 14:48:00
数据当然不只有 OPS+, 还有像是讨论价值用 WAR
作者: tlchen (台湾加油)   2014-03-08 14:49:00
统计量本身没有错,但不知统叶量该怎么用,被海放只是刚好
作者: tlchen (台湾加油)   2014-03-08 14:50:00
机密的东西,做到多好,看不到无法评论
作者: tlchen (台湾加油)   2014-03-08 14:51:00
但以目前 Sabermetrics 所公开展现的东西我是真的认为,硕士生就能做得比他们好
作者: maxspeed150 (听说茉夏分手了)   2014-03-08 14:52:00
FG或BR这种放来给大家wow一下的数据本来就是如此
作者: tlchen (台湾加油)   2014-03-08 14:52:00
当然,若是跟着目前主流 Sabermetrics 的作法,那不会有
作者: maxspeed150 (听说茉夏分手了)   2014-03-08 14:53:00
同 但是talent分布理论上差距不会太大
作者: tlchen (台湾加油)   2014-03-08 14:53:00
什么特别的东西.得要自己重新去想想,到底怎样才是合适的
作者: tlchen (台湾加油)   2014-03-08 14:54:00
WAR 要衡量 talent, 我没有太大的意见
作者: tlchen (台湾加油)   2014-03-08 14:55:00
但要来衡量贡献度,那叫挂羊头卖狗肉
作者: idtvgame (唉低电视游戏)   2014-03-08 14:55:00
你为什么这么有把握你幻想中的硕士生能想出一个"特别又
作者: chordate (封侯事在)   2014-03-08 14:56:00
衡量talent比衡量贡献渡还难耶=.=
作者: maxspeed150 (听说茉夏分手了)   2014-03-08 14:56:00
t大上次吵过一次的论点我还记得啦 他就是认为关键时刻的关键一击才是贡献度的重点
作者: tlchen (台湾加油)   2014-03-08 14:57:00
不用特别又创新,而是适不适合.就像 z-score 就足以海放那些 xxxx+
作者: chordate (封侯事在)   2014-03-08 14:57:00
那早就有WPA满足你对关键一击的的重视了
作者: maxspeed150 (听说茉夏分手了)   2014-03-08 14:58:00
xxxx+是个简单的数据 只是代表一个球员"比平均"好多少
作者: tlchen (台湾加油)   2014-03-08 14:58:00
我的确认为在衡量贡献度上,WPA 远胜 WAR
作者: tlchen (台湾加油)   2014-03-08 14:59:00
贡献度是看已发生的表现,而不是预测未来的表现或本身能力
作者: chordate (封侯事在)   2014-03-08 14:59:00
你确定大联盟是常态分布再来用z-core
作者: tlchen (台湾加油)   2014-03-08 15:00:00
z-score 也同样可以看比平均好多少
作者: tlchen (台湾加油)   2014-03-08 15:01:00
我前面也说过,z-score 用来看极端值一样不可靠
作者: idtvgame (唉低电视游戏)   2014-03-08 15:01:00
如果你觉得标准化这么有代表性 欢迎写一写你投期刊....
作者: tlchen (台湾加油)   2014-03-08 15:03:00
我不认为 z-score 比 xxx+ 有代表性,能投上什么期刊 :)
作者: idtvgame (唉低电视游戏)   2014-03-08 15:04:00
我只是想做 做这些东西的人很多..没有您讲的这么不堪这样
作者: tlchen (台湾加油)   2014-03-08 15:04:00
看统计量,看它跟平均的比,去问问哪个统计的人信服当然啦,除非是大家已知那统计量要取 log 来处理比较准
作者: tlchen (台湾加油)   2014-03-08 15:05:00
像是照片中的 intensity
作者: idtvgame (唉低电视游戏)   2014-03-08 15:05:00
就我看Journal of Sports Economics里面最少超过20篇
作者: tlchen (台湾加油)   2014-03-08 15:06:00
在那样的情况下,看比例,等于看 log 后的差距
作者: idtvgame (唉低电视游戏)   2014-03-08 15:06:00
讲棒球的文章在用你所谓的xxxx+ 再做回归如果你能讲出他们用的东西没用...那是还蛮值得丢期刊的阿
作者: tlchen (台湾加油)   2014-03-08 15:07:00
20 篇是指 z-score 比 xxxx+ 的比较?
作者: chordate (封侯事在)   2014-03-08 15:07:00
你这一讲就漏馅了,你只是认为用减的比用除的好而已
作者: tlchen (台湾加油)   2014-03-08 15:08:00
我只能说,统计的人,根本不可能去认为 xxx+ 有机会而去用
作者: idtvgame (唉低电视游戏)   2014-03-08 15:09:00
不是 是他们xxx+在当类似球员表现的分析
作者: chordate (封侯事在)   2014-03-08 15:09:00
那一个比较好明明就是要看跟实际状况预测起来吻不吻合
作者: chordate (封侯事在)   2014-03-08 15:10:00
就像RC公式该不该全是线性组合一样除非是完全按照打棒球的机制去模拟
作者: chordate (封侯事在)   2014-03-08 15:11:00
要不然线性组合就只是近似而已这是就会有人跳出来说,棒球的分数哪里是这样生成的
作者: chordate (封侯事在)   2014-03-08 15:12:00
所以这个不对怎么样的
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:16:00
岔题,Z score,12-13 trout 2.6,01-02 Pujols 1.5
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:17:00
样本为PA qualified打者。待会做全打者
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:18:00
12-13比01-02近似常态,1213 avg .338, stdev .078
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:19:00
01-02 avg .351 stdev .062. 做完再上图
作者: maxspeed150 (听说茉夏分手了)   2014-03-08 15:20:00
用wOBA做的?
作者: chordate (封侯事在)   2014-03-08 15:21:00
问一下资料来源是http://www.baseball-databank.org/吗
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:23:00
IQR/1.35 0102=0.03 1213=0.04
作者: tlchen (台湾加油)   2014-03-08 15:24:00
看跟实状况预测起来吻不吻合?是要叫张飞跟岳飞真的打一场?
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:24:00
作者: tlchen (台湾加油)   2014-03-08 15:25:00
若有兴趣,不如随便找两个 mean 不是零的分布,然后各抽样
作者: tlchen (台湾加油)   2014-03-08 15:26:00
样个几百个,然后自己看一下,z-score 跟 xxx+ 那个比较准
作者: Yukirin (いい天気!)   2014-03-08 15:27:00
海放 XDDDDDDDD我每天钻这个都没这自信了你什么豹子胆啊XD
作者: tlchen (台湾加油)   2014-03-08 15:27:00
多做几次,或许就有感觉,这为什么根本没什么好争论的
作者: chordate (封侯事在)   2014-03-08 15:28:00
找exponential distribution 出来的结果不就好了
作者: tlchen (台湾加油)   2014-03-08 15:32:00
如果你认为 exponential distribution 合理,那你赢了前面已经推过,除非已知取 log 后来处理是比较有意义的
作者: chordate (封侯事在)   2014-03-08 15:33:00
已知已知,不要忘了已知是怎么来的
作者: tlchen (台湾加油)   2014-03-08 15:33:00
你认为那些数据该先取 log 的话,那我也不便多说什么了
作者: ChaosK (三星手机炸飞机)   2014-03-08 18:12:00
为什么一定要张飞打岳飞,可不可以关羽打项羽?
作者: best2008 (静香爱洗澡)   2014-03-08 19:25:00
都不要看数据 就好了(误
作者: fan0226 (YI)   2014-03-08 19:56:00
任何数据都不是完美的qq
作者: TSbb (贷款三十年债开始)   2014-03-11 15:58:00
海放勒,超好笑的

Links booklink

Contact Us: admin [ a t ] ucptt.com