这是用分析棒球比赛常用的WAR来分析历史上战役
不过作者也说这模型还不严谨
只是一个有趣的实验
当做等跨年时打发时间的闲聊看看吧
https://buzzorange.com/techorange/2017/12/28/math-prove-who-is-best-general/
用数学分析 3500 场战役、6600 位将领的数据后,我们得出了史上最强的将军
就像汉尼拔一样,我想给战争史上有名的将领排个名。与汉尼拔不同,我希望通过数据来
评定每位将领的能力,而不是根据个人的成就。 我的模型可以给军事历史上的每位杰出
的指挥官排序。
方法:棒球比赛的启发 ─ 额外胜利数(WAR)
受到棒球比赛的启发,我选择使用额外胜利数(WAR)作为评估体系。WAR 体系经常用来
估算棒球选手对其球队的贡献。它能计算出相对于替补队员上场,选手对其球队的贡献。
例如,相对于一个高级别小联盟球员的平均贡献得分,一位 5 WAR 的棒球选手可以为其
团队贡献 5 个得分。 WAR 的缺陷还有很多,但它可以根据数据评估选手的能力。
因此,我希望利用 WAR 来评估每位将领作出的贡献是处于平均水平之上还是之下。 下面
我将解释我的模型在不同情况下如何计算出平均水平。 我甚至可以根据一位将领在相同
的情况下(假设替补将军处于平均水平)和替补将领的差距来评估他的能力。 换句话说
,我能计算出所有将军的 WAR。
数据:维基百科上 3580 场独立战争与 6619 位将军
我面临的第一个挑战是如何构建一个可靠的数据集。 由于找不到一个全面的历史战争数
据集,我决定自己动手建立。维基百科的战争列表包括 3580 场独立战争和 6619 位将军
。虽然不够全面,但维基百科的列表为我将要建立的模型提供了足够的样本。
然后,我开发了一个功能,可以为每场战斗提供关键讯息,包括参与战斗的所有指挥官,
指挥官可用的总兵力以及战斗结果。 由此产生的数据集为建立基准水平提供了大量的战
斗样本。我将拿其他将军和这个基准水平作对比。
以这个战斗样本为基准,我构建了一个线性模型。 我把每场战斗的兵力分成步兵,骑兵
,炮兵,空军和海军。 根据一位将军的对手的情况,我能计算出其优势或劣势的数值。
然而该模型算出的数值非常保守,这表明与其他因素(如地形或技术)相比,新兵数量的
影响相对较小,这一点值得深入探究。 然而,在这个项目的结果中,指挥官的战术敏锐
度与其他因素相比更为重要。
我已准备好给每位将军排名,然后深入研究排名结果。
方法如下:我先将每位将军指挥的战斗分开来看,然后给每场战斗中他们的表现一个
WAR 分数。 例如,法国皇帝拿破仑在波罗底诺战役中获得 49 WAR。 由于法国军队略逊
于俄罗斯帝国的战斗力,该模型得出拿破仑位置的替补将军有 51% 的胜算。WAR 系统认
为拿破仑百分百能够胜利,减去替补将军的胜算,拿破仑比替补高出 0 .49 。
对于计算失败率,该系统也使用了类似的方法。 例如,在波罗底诺战役中,拿破仑的对
手,俄罗斯将军米哈伊尔‧库图佐夫(Mikhail Kutuzov)得到了 -0.49 WAR。 由于失败
,他取得了 -1 个胜利,但是替补将军也有 51% 的可能会输。
结果:拿破仑第一名,第二名凯萨还不及他的一半
在所有的将领中,拿破仑的 WAR 最高(16.679)。 事实上,第二名是凯撒(Julius
Caesar,7.445 WAR),但他的战绩还不到拿破仑的一半。
拿破仑的优势在于他指挥的战斗数量很多。 在他的 43 场战斗中,赢了 38 场,仅输了
5 场。拿破仑在 17 场战斗中攻克艰险取得胜利,在 5 场战斗中转败为胜。在战争数量
上,没有人可以与拿破仑匹敌。
拿破仑指挥了 43 场战斗,第二名罗伯特‧E‧李(Robert E. Lee),共指挥了 27 场战
斗(平均战斗场数为 1.5)。因为指挥战斗的次数多,拿破仑有更多的机会展示自己的实
力。 亚历山大大帝虽然在总共的 9 场战斗中全部取胜,但由于他参战次数过少,时间较
短,取得的 WAR 也较低。
除了拿破仑这个例外,其他的将领的 WAR 都比较平均。 这表明拿破仑的成功是因为其指
挥才能卓越,模型的结果没有问题。拿破仑的 WAR 与数据集中将领的平均 WAR 差距为
23。
数据观察:名声大不代表一定好
还有一些将领,他们虽然名声很大,但是 WAR 低的惊人。美国南方联盟的
司令罗伯特‧E‧李(Robert E. Lee)的 WAR 为-1.89,这表明处于平均水平的将领比
Lee 还要成功。Lee 处于不利地位,因为他军队规模和资源都有限。 尽管如此,他也实
在称不上战略家这个称号。有些历史学家批评了他的作战战略和指挥关键战役的方式。他
的 WAR 证明这些历史学家的想法是对的。例如, 在葛底斯堡战役的最后一天,Lee 指挥
的“皮克特冲锋”真是一场灾难。 用南卡罗来纳大学教授托马斯‧康利(Thomas
Connely)的话来说,“如果没有罗伯特‧李(Robert E. Lee),南方的情况可能不会那
么糟。
二战期间,德国陆军元帅欧文‧隆美尔(Erwin Rommel)因在北非的战役取得成功,绰号
“沙漠之狐”。在这个模型中,他的成绩也不佳,最终战绩为-1.953。 这和近代将领,
包括诺曼‧施瓦茨科普夫和阿里尔‧沙龙,对隆美尔的赞誉不太一致。像 Lee 一样,隆
美尔一直是历史上颇有争议的人物。批评家认为他之所以被称作作战天才,主要是因为德
国和盟国的宣传。 据报导,英国将领夸大隆美尔的作战能力是为了掩盖自己失败。
近代将领成绩差,因为参与数太低了
在模型中,近代将领的成绩相对较差。美国将军乔治‧S‧巴顿(George S. Patton)被
历史学家特里‧布莱顿(Terry Brighton)称作“二战中最伟大的将军”之一,而他也只
获得了 0.9WAR。 近代将领的 WAR 较低可能是因为他们参加的战争数量较少。
二战后的将领中,以色列指挥官脱颖而出。以色列军方领导人摩西‧达扬获得了
2.109WAR(共指挥 60 场战斗)。他的 WAR 是近代将领中非常出色的,但与 20 世纪前
的将领相比,还是稍逊一筹。以色列前总理沙龙(Ariel Sharon)在苏伊士危机,六日战
争和赎罪日战争中取得胜利,因此获得了 2.171WAR(总指挥 58 场战斗)。
汉尼拔当年的评估:低估了自己,高估了对手
最后,我把汉尼拔对这些将领的评估与我的模型结果进行了比较。根据 WAR 值,汉尼拔
低估了自己的能力。汉尼拔的 WAR 最高,达到了 5.519(总计第六)。亚历山大大帝被
汉尼拔(Hannibal)排在第一。
在我的模型中,他稍逊于汉尼拔,获得了 4.391 WAR(总计第 10 位)。经历 9 场战斗
后,亚历山大就去世了,但他赢得了所有的战斗。汉尼拔共经历 17 次战斗,赢了 13 场
,输了 2 场,撤退 2 场。
因此,我和汉尼拔的评估是一致的,即虽然汉尼拔参与战斗更多,但亚历山大才是实至名
归的战术家,他展示了自己的作战能力。如果不是疾病,他可能会继续打胜仗。
然而,我的发现不同于汉尼拔对希腊将军 Pyrrhus of Epirus 的评估。在我的模特中,
Pyrrhus 只有 3 次战斗记录,得到了-0.53 WAR。虽然汉尼拔把创新的军事策略归功于
Pyrrhus ,但是无法证明 Pyrrhus 的策略一定能在战争中取胜。因此我对他的战术深表
怀疑。
我的模型可以更加有趣客观地评估各将领的作战能力。WAR 为以后的研究提供了范例,未
来的研究也可以通过扩大数据集和改进其他因素来改善这个模型。
基于读者的反馈,我想先明确自己的立场。首先,这篇文章的目的只是为了和大家分享一
个有趣的实验,而不是确定性的排名,也不是对军事历史的学术贡献。
此外,我的很多资料都来源于维基百科,因此我的模型存在漏洞。由于缺乏资源,数据可
能不是非常精确。
我相信绝大多数读者阅读这篇文章是出于对我实验的兴趣。感谢大家的支持和意见!
原文作者:Ethan Arsht