原文恕删
re24 是我今天才了解的棒球统计量
我对于推文里对这个统计量,
所提出的质疑,
同样也感到好奇,
所以刚刚写了蒙地卡罗模拟,
来看看大谷翔平在24种情境下,
他的 RE24 表现。
设定
1. 每种情况模拟 5000w 次
2. 没有盗垒。
3. 高飞球若无三出局,
垒包上所有跑者必推进一个垒包
4. 1b 2b 3b hr所有垒包上的跑者,
分别前进 1, 2, 3, 4 个垒包。
5. go, so 不推进垒包,出局加一。
详细的模拟程式
https://github.com/JoshXie0809/mlb_re24/blob/master/src/main.rs
视觉化程式
https://github.com/JoshXie0809/mlb_re24/blob/master/src/mlb_er24.ipynb
那简单的结论可以看到
https://i.imgur.com/fu4dwtp.png
推文认为垒包上情况,
会影响到re24 的表现。
但模拟的结果却有点有趣,
当我们忽略掉满垒的情况时,
由模拟结果可以发现,
re24 的表现,
对于大谷而言,
分配情况其实算得上均匀,
不会有某块忽高忽低。
所以对于打者无法决定垒上有人的情况,
会造成re24 不公平的担忧,
应该还算可以接受?
但满垒带来的高报酬,
似乎有点不公平?
特别是道奇这种强队,
很容易有满垒的局面。
https://i.imgur.com/OjXDIx6.png
但我们都知道,
高报酬往往伴随高风险,
由模拟的标准差计算可以发现,
满垒下的标准差,
或 3垒有人的情况下,
只要打不好,
re24 的反面校正。
所以并不是垒包有人对于累积数据,
就比较有利。
如果选手无法将垒包打回来,
re24 会让打者的数据差到无法想像。
因此,对于不够强的选手,
反而会更不希望垒包有人才对。
后续我会继续实验不同球员,
和棒次对于re24的影响。
还蛮喜欢这个数据的,
毕竟我算是半个谷黑吧^^(开玩笑的