LM模型: Runs ~ Hits + HR + BB + SO + SB + LOB + GIDP
Summary
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.57802 0.56442 -2.796 0.010534 *
Hits 0.83505 0.07197 11.603 7.57e-11 ***
HR 0.45883 0.15011 3.057 0.005781 **
BB 0.67218 0.08538 7.873 7.70e-08 ***
SO -0.01054 0.03427 -0.308 0.761327
SB 0.08393 0.10157 0.826 0.417501
LOB -0.47437 0.10059 -4.716 0.000105 ***
GIDP -0.67690 0.15199 -4.453 0.000199 ***
Multiple R-squared: 0.9718, Adjusted R-squared: 0.9628
首先,这结果告诉我们,用以上这些参数来估计所得分数可以估的相当的准确。
这些各样打击数据,几乎可以解释97%会得多少分的影响。
安打,HR,获得保送,如常识所知的会提高得分。
盗垒多会增加多一点点的得分,三振多则会使得分少一点点,不过影响都不明显。
安打、HR、保送对分数的重要性,我配了另外一个模型为了避免共线性
安打 : HR : 保送 对分数影响的比重为 1 : 2.4 : 0.7
残垒多的球队会使得分减少,双杀更是明显的影响着得分,
大约每次双杀会使得得分少得0.6分。
最后则是来看看各队的期望得分与实际得分。
RS/G 期望RS/G 分数差 名次差
BOS 5.355 5.324 0.030
NYY 5.152 4.981 0.171
TEX 4.938 4.869 0.069
TOR 4.708 4.826 -0.118
CIN 4.705 4.712 -0.007 +1
STL 4.663 4.747 -0.084 -1
ARI 4.495 4.619 -0.124
NYM 4.436 4.500 -0.064
COL 4.432 4.418 0.014 +1
DET 4.411 4.458 -0.048 -1
CLE 4.387 4.281 0.107 +4
MIL 4.375 4.405 -0.030
KC 4.358 4.401 -0.043
PHI 4.266 4.188 0.078 +2
TB 4.237 4.405 -0.168 -4
BAL 4.109 4.290 -0.182 -2
ATL 4.074 4.133 -0.059
CHC 4.042 4.014 0.028 +1
CWS 4.021 4.077 -0.056 -1
FLA 3.989 3.961 0.028
PIT 3.968 3.886 0.081 +1
MIN 3.914 3.874 0.040 +1
HOU 3.884 3.787 0.097 +2
WAS 3.853 3.665 0.188 +3
ANA 3.813 3.918 -0.106 -4
LA 3.674 3.806 -0.132 -2
SF 3.656 3.713 -0.057 -1
OAK 3.490 3.346 0.143 +1
SD 3.344 3.370 -0.026 -1
SEA 3.189 3.225 -0.036