※ 引述《tatsumi2512 (Ben)》之铭言:
: 小弟发现自己的文章打太长了,无法在自己原本自己的文章下回完,
: 而且尚需要不止1篇的发文,很抱歉变成变相的洗板。m(_ _)m
: to gamer大:
: 抱歉,我统计学的东西几乎都已经还给老师了。
: 所谓对1B作normaliezed的意思是让1B在上述假设的情况下,
: 在XR以及在OPS的权重都调整为1吗?
: 若是如此,那小弟有个疑问:
: 原uranusjr大的权重如下:
: BB 1B 2B 3B HR
: XR 2.0 3.0 4.0 6.0 8.5
: OPS 2.0 4.2 6.4 8.6 10.8
: 若以BB为基准 = 1时,则 (小数点一下3位四舍五入)
: BB 1B 2B 3B HR
: XR 1.00 1.50 2.00 3.00 4.25
: OPS 1.00 2.10 3.20 4.30 5.40
: - 高估 高估 高估 高估
: 若以1B为基准 = 1时,则 (小数点一下3位四舍五入)
: BB 1B 2B 3B HR
: XR 0.67 1.00 1.33 2.00 2.83
: OPS 0.48 1.00 1.52 2.05 2.57
: 低估 - 高估 高估 低估
: 若以2B为基准 = 1时,则 (小数点一下3位四舍五入)
: BB 1B 2B 3B HR
: XR 0.50 0.75 1.00 1.50 2.13
: OPS 0.31 0.66 1.00 1.34 1.69
: 低估 低估 - 低估 低估
: 若以3B为基准 = 1时,则 (小数点一下3位四舍五入)
: BB 1B 2B 3B HR
: XR 0.33 0.50 0.67 1.00 1.42
: OPS 0.23 0.49 0.74 1.00 1.26
: 低估 低估 高估 - 低估
: 若以HR为基准 = 1时,则 (小数点一下3位四舍五入)
: BB 1B 2B 3B HR
: XR 0.24 0.35 0.47 0.71 1.00
: OPS 0.19 0.39 0.59 0.80 1.00
: 低估 高估 高估 高估 -
: 可以看出,
: 除BB为基准 = 1时以外,BB永远被低估。
: 另,除2B为基准 = 1时以外,2B永远被高估。
: 但1B, 3B, HR在不同的基准下,有时被高估有时被低估。
: 要如何解释这种情况呢?
: 是不是在任意调整权数的情况下,
: 比较的基准其实早已跑掉了呢?
: 以上述uranusjr大简化OPS公式,
: 以1.1 AB = 1 PA得出的下列权重,
: >OPS * n AB = BB + (1 + n) 1B + (1 + 2n) 2B + (1 + 3n) 3B + (1 + 4n) HR
: >所以对于 n = 1.1 而言, 各项权重比为
: >2 : 4.2 : 6.4 : 8.6 : 10.8
: 是不是已经出现误差。
: 毕竟,n = 1.1时,上述
: OPS * n AB = BB + (1 + n) 1B + (1 + 2n) 2B + (1 + 3n) 3B + (1 + 4n) HR
: 可以换算成
: OPS * PA = OPS * 1.1 * AB = 1 * BB + 2.1 * 1B + 3.2 * 2B + 4.3 * 3B + 5.4 * HR
: 其BB, 1B, 2B, 3B, HR的权数应该分别为1, 2.1, 3.2, 4.3, 5.4,
: 但uranusjr大在这里把各权数 * 2,
: 则
: OPS * PA = OPS * 1.1 * AB = 1 * BB + 2.1 * 1B + 3.2 * 2B + 4.3 * 3B + 5.4 * HR
: 会变成
: 2 * OPS * PA = OPS * 2.2 * AB = 2 * BB + 4.2 * 1B + 6.4 * 2B + 8.6 * 3B +
: 10.8 * HR
: 但其实实际上左式会变成 OPS * PA * 2,或OPS * 2.2 * AB。
: 待续。。
回归分析是一个边际的概念,也就是说当已经考虑了其中几个变项时额外
再加入一个变项有多少的影响力(R-square)。以你的例子里,这种高低估的说法
有一点点诡异,因为回归本身就已经考量了一组资料元素才根据边际效果导出
一组数据,考量的讯息本身就已经包括你所谓的其他资料。所以我有点看不太懂
为什么会有高估跟低估的结论?除非说写model的人自己加权,将HR的数据加权后再
丢进回归里跑,那应该也只有写model的人才知道吧。
此外,由于现在非线性回归的使用增多,复杂模型的数据模式比较常出现,
我猜我们所看到的数据资料应该不会只是单纯的线性回归产物。
不负责任回答~