中线定理是叙述三角形两边和中线长度关系的一个欧氏几何定理,
大家在高中数学的三角比(三角函数)章节应该有学过。
根据中线定理,我们可以知道三角形两边的平方和,
等于第三边的半边长平方和中线长加起来的两倍。
刚好棒球的数据也可以分为进攻和防守两大类,
如果我们把三角形的两边看作是进攻和防守,
第三边的半边长看作球队气氛,
这样的话,中线长是否可以用来预估球队的胜率呢?
https://i.imgur.com/ZKBdJfe.jpg
秉持着科学的精神,我们来计算一下。
首先,定义球队的进攻指数,
这里用了两种数据,其中之一是OPS,
另一个则是打点数除以打数。
OPS可以反应出球队上垒跟长打的机率,
而打点数/打数则是跟球队得分能力有更直接的关联。
防守指数的计算,这里采用两种算法,
第一种算法是单纯计算团队ERA,
第二种算法是除了ERA之外,也把自责分/失分的比例纳入计算。
另外,球队气氛对战绩也有不小的影响,这里使用气氛常数0.801做计算。
所有团队数据都以联盟平均数据做标准化。
公式如下:
https://i.imgur.com/yIZsfpC.jpg
以2021年的MLB数据为例,
如果防守指数只考虑团队ERA的话,
可以看到用上述公式计算出来的中线长跟胜率的R平方值有0.8775。
https://i.imgur.com/c9rZYA3.jpg
如果把自责分/失分的比例加进来的话,
中线长跟胜率的R平方值会提升到0.9002,
显示这样的计算可以很好的预测球队胜率。
https://i.imgur.com/nVQKtNh.jpg
接着,我们将这样的公式应用在2022赛季,
就MLB的数据来说,
2022赛季数据计算出来的中线长和胜率的相关性误差比较大,
可能是因为进行场数不够多,成绩的浮动还是较大。
两种防守指数计算出来的R平方值只有0.6025和0.6635
https://i.imgur.com/jS4fhum.jpg
https://i.imgur.com/eTHQGEE.jpg
那这样的公式是否也能应用在中职呢?
用2022赛季的中职数据计算可以发现一个有趣的结果,
两种防守指数的计算的相关性都比2022赛季的MLB更高!
https://i.imgur.com/r4uWmZ6.jpg
https://i.imgur.com/Lrvn7cH.jpg
给直接END的人:结论是棒球中线定理可以作为胜率预测的参考工具。
因为很多人问气氛常数到底怎么来的,
让我们来试试看到底气氛常数到底应该订多少比较合理,
因为气氛常数不能为0,所以从0.05开始,
以下是计算出来的结果,显示气氛常数0.801算是满合理的数字~
https://i.imgur.com/Y6szFpv.jpg