Re: [闲聊] 今日Pujols。 ppoll2 PTT批踢踢实业坊

Re: [闲聊] 今日Pujols。

楼主: ppoll2 (Stat Counseling) 2011-09-05 01:20:13

※ 引述《tatsumi2512 (Ben)》之铭言：
: 小弟发现自己的文章打太长了，无法在自己原本自己的文章下回完，
: 而且尚需要不止1篇的发文，很抱歉变成变相的洗板。m(_ _)m
: to gamer大：
: 抱歉，我统计学的东西几乎都已经还给老师了。
: 所谓对1B作normaliezed的意思是让1B在上述假设的情况下，
: 在XR以及在OPS的权重都调整为1吗？
: 若是如此，那小弟有个疑问：
: 原uranusjr大的权重如下：
: BB 1B 2B 3B HR
: XR 2.0 3.0 4.0 6.0 8.5
: OPS 2.0 4.2 6.4 8.6 10.8
: 若以BB为基准 = 1时，则 (小数点一下3位四舍五入)
: BB 1B 2B 3B HR
: XR 1.00 1.50 2.00 3.00 4.25
: OPS 1.00 2.10 3.20 4.30 5.40
: - 高估高估高估高估
: 若以1B为基准 = 1时，则 (小数点一下3位四舍五入)
: BB 1B 2B 3B HR
: XR 0.67 1.00 1.33 2.00 2.83
: OPS 0.48 1.00 1.52 2.05 2.57
: 低估 - 高估高估低估
: 若以2B为基准 = 1时，则 (小数点一下3位四舍五入)
: BB 1B 2B 3B HR
: XR 0.50 0.75 1.00 1.50 2.13
: OPS 0.31 0.66 1.00 1.34 1.69
: 低估低估 - 低估低估
: 若以3B为基准 = 1时，则 (小数点一下3位四舍五入)
: BB 1B 2B 3B HR
: XR 0.33 0.50 0.67 1.00 1.42
: OPS 0.23 0.49 0.74 1.00 1.26
: 低估低估高估 - 低估
: 若以HR为基准 = 1时，则 (小数点一下3位四舍五入)
: BB 1B 2B 3B HR
: XR 0.24 0.35 0.47 0.71 1.00
: OPS 0.19 0.39 0.59 0.80 1.00
: 低估高估高估高估 -
: 可以看出，
: 除BB为基准 = 1时以外，BB永远被低估。
: 另，除2B为基准 = 1时以外，2B永远被高估。
: 但1B, 3B, HR在不同的基准下，有时被高估有时被低估。
: 要如何解释这种情况呢？
: 是不是在任意调整权数的情况下，
: 比较的基准其实早已跑掉了呢？
: 以上述uranusjr大简化OPS公式，
: 以1.1 AB = 1 PA得出的下列权重，
: >OPS * n AB = BB + (1 + n) 1B + (1 + 2n) 2B + (1 + 3n) 3B + (1 + 4n) HR
: >所以对于 n = 1.1 而言, 各项权重比为
: >2 : 4.2 : 6.4 : 8.6 : 10.8
: 是不是已经出现误差。
: 毕竟，n = 1.1时，上述
: OPS * n AB = BB + (1 + n) 1B + (1 + 2n) 2B + (1 + 3n) 3B + (1 + 4n) HR
: 可以换算成
: OPS * PA = OPS * 1.1 * AB = 1 * BB + 2.1 * 1B + 3.2 * 2B + 4.3 * 3B + 5.4 * HR
: 其BB, 1B, 2B, 3B, HR的权数应该分别为1, 2.1, 3.2, 4.3, 5.4，
: 但uranusjr大在这里把各权数 * 2，
: 则
: OPS * PA = OPS * 1.1 * AB = 1 * BB + 2.1 * 1B + 3.2 * 2B + 4.3 * 3B + 5.4 * HR
: 会变成
: 2 * OPS * PA = OPS * 2.2 * AB = 2 * BB + 4.2 * 1B + 6.4 * 2B + 8.6 * 3B +
: 10.8 * HR
: 但其实实际上左式会变成 OPS * PA * 2，或OPS * 2.2 * AB。
: 待续。。
回归分析是一个边际的概念，也就是说当已经考虑了其中几个变项时额外
再加入一个变项有多少的影响力(R-square)。以你的例子里，这种高低估的说法
有一点点诡异，因为回归本身就已经考量了一组资料元素才根据边际效果导出
一组数据，考量的讯息本身就已经包括你所谓的其他资料。所以我有点看不太懂
为什么会有高估跟低估的结论？除非说写model的人自己加权，将HR的数据加权后再
丢进回归里跑，那应该也只有写model的人才知道吧。
此外，由于现在非线性回归的使用增多，复杂模型的数据模式比较常出现，
我猜我们所看到的数据资料应该不会只是单纯的线性回归产物。
不负责任回答~

作者: tatsumi2512 (tatsumi2512) 2011-09-05 01:24:00

谢谢解说。本来只是单纯把自己的疑问提出来而已，

作者: tatsumi2512 (tatsumi2512) 2011-09-05 01:25:00

结果就变成上面那种情况了。。。

作者: tatsumi2512 (tatsumi2512) 2011-09-05 01:26:00

其实还有很长一段我重新编辑在上一篇文章中，

楼主: ppoll2 (Stat Counseling) 2011-09-05 01:26:00

不在我的意思里我觉得不能够直接对回归系数进行加减乘除

楼主: ppoll2 (Stat Counseling) 2011-09-05 01:27:00

= = 应该说没有人会这样做才对

作者: EEERRIICC (å¤§å°¾é¯è›‡) 2011-09-05 01:27:00

................

作者: tatsumi2512 (tatsumi2512) 2011-09-05 01:28:00

若ppoll2大有空闲的话，还请不吝指教。m(_ _)m

作者: tatsumi2512 (tatsumi2512) 2011-09-05 01:29:00

我发现我在找死。都是你啦，uranusjr大。(指) XD

作者: tatsumi2512 (tatsumi2512) 2011-09-05 01:35:00

谢谢ppoll2大的解释，我能够理解你要说的内容。

作者: fenix800704 (Fenix) 2011-09-05 01:36:00

这一系列数学文Q^Q

作者: Tulowitzki2 (图喏) 2011-09-05 01:36:00

推

作者: tatsumi2512 (tatsumi2512) 2011-09-05 01:37:00

当初是边打文章边得出：权数直接拿来乘除不会很奇怪吗

作者: tatsumi2512 (tatsumi2512) 2011-09-05 01:38:00

现在发现只要看ppoll2大的：我觉得不能够直接对回归系数进行加减乘除

作者: tatsumi2512 (tatsumi2512) 2011-09-05 01:39:00

这一句话就可以解释我最大的疑惑了。谢谢。m(_ _)m

看棒球，学数学。

作者: SCGT 2011-09-05 03:01:00

这串看下来真可怕

作者: jayin07 ( ⊙o⊙) 2011-09-05 05:00:00

许公....救命......

作者: simple721 (姑嫂丸给我拿出来) 2011-09-05 12:32:00

为什么不行啧啧

作者: tatsumi2512 (tatsumi2512) 2011-09-05 14:17:00

小弟认为ppoll2大解释回归分析解答了我许多的疑惑。

作者: tatsumi2512 (tatsumi2512) 2011-09-05 14:19:00

想请教simple721大，若可以，是会出现在什么情况下呢

作者: CarlvinPiz22 (外套) 2011-09-05 14:43:00

标题火星人，内容火星文....(我是指我程度差看不懂)

作者: EEERRIICC (å¤§å°¾é¯è›‡) 2011-09-05 14:50:00

完全看不懂

继续阅读

Re: [问题] 电影魔球的真实故事?ONISUKA Re: [闲聊] 今日Pujols。uranusjr [闲聊] 想神影片adamp3 [情报] 今日 MLB 投打表现 (2011.09.03)user043 [影片] 今日 MLB 赛事精华 (2011.09.03)user043 Re: [闲聊] 连续打席打点leddy [问题] 现在买MLB TVspreesell6 [闲聊] 连续打席打点LAKOBELA Re: [闲聊] 今日Pujols。tatsumi2512 [情报] Lincecum连四年200K达成abc12812