[闲聊] 用数学分析 3500 场战役、6600 位将领的 Su22 PTT批踢踢实业坊

[闲聊] 用数学分析 3500 场战役、6600 位将领的

楼主: Su22 (装配匠) 2017-12-31 18:45:38

这是用分析棒球比赛常用的WAR来分析历史上战役
不过作者也说这模型还不严谨
只是一个有趣的实验
当做等跨年时打发时间的闲聊看看吧
https://buzzorange.com/techorange/2017/12/28/math-prove-who-is-best-general/
用数学分析 3500 场战役、6600 位将领的数据后，我们得出了史上最强的将军
就像汉尼拔一样，我想给战争史上有名的将领排个名。与汉尼拔不同，我希望通过数据来
评定每位将领的能力，而不是根据个人的成就。我的模型可以给军事历史上的每位杰出
的指挥官排序。
方法：棒球比赛的启发 ─ 额外胜利数（WAR）
受到棒球比赛的启发，我选择使用额外胜利数（WAR）作为评估体系。WAR　体系经常用来
估算棒球选手对其球队的贡献。它能计算出相对于替补队员上场，选手对其球队的贡献。
例如，相对于一个高级别小联盟球员的平均贡献得分，一位 5 WAR 的棒球选手可以为其
团队贡献 5 个得分。 WAR 的缺陷还有很多，但它可以根据数据评估选手的能力。
因此，我希望利用 WAR 来评估每位将领作出的贡献是处于平均水平之上还是之下。下面
我将解释我的模型在不同情况下如何计算出平均水平。我甚至可以根据一位将领在相同
的情况下（假设替补将军处于平均水平）和替补将领的差距来评估他的能力。换句话说
，我能计算出所有将军的 WAR。
数据：维基百科上 3580 场独立战争与 6619 位将军
我面临的第一个挑战是如何构建一个可靠的数据集。由于找不到一个全面的历史战争数
据集，我决定自己动手建立。维基百科的战争列表包括 3580 场独立战争和 6619 位将军
。虽然不够全面，但维基百科的列表为我将要建立的模型提供了足够的样本。
然后，我开发了一个功能，可以为每场战斗提供关键讯息，包括参与战斗的所有指挥官，
指挥官可用的总兵力以及战斗结果。由此产生的数据集为建立基准水平提供了大量的战
斗样本。我将拿其他将军和这个基准水平作对比。
以这个战斗样本为基准，我构建了一个线性模型。我把每场战斗的兵力分成步兵，骑兵
，炮兵，空军和海军。根据一位将军的对手的情况，我能计算出其优势或劣势的数值。
然而该模型算出的数值非常保守，这表明与其他因素（如地形或技术）相比，新兵数量的
影响相对较小，这一点值得深入探究。然而，在这个项目的结果中，指挥官的战术敏锐
度与其他因素相比更为重要。
我已准备好给每位将军排名，然后深入研究排名结果。
方法如下：我先将每位将军指挥的战斗分开来看，然后给每场战斗中他们的表现一个
WAR 分数。例如，法国皇帝拿破仑在波罗底诺战役中获得 49 WAR。由于法国军队略逊
于俄罗斯帝国的战斗力，该模型得出拿破仑位置的替补将军有 51％的胜算。WAR 系统认
为拿破仑百分百能够胜利，减去替补将军的胜算，拿破仑比替补高出 0 .49 。
对于计算失败率，该系统也使用了类似的方法。例如，在波罗底诺战役中，拿破仑的对
手，俄罗斯将军米哈伊尔‧库图佐夫（Mikhail Kutuzov）得到了 -0.49 WAR。由于失败
，他取得了 -1 个胜利，但是替补将军也有 51％的可能会输。
结果：拿破仑第一名，第二名凯萨还不及他的一半
在所有的将领中，拿破仑的 WAR 最高（16.679）。事实上，第二名是凯撒（Julius
Caesar，7.445 WAR），但他的战绩还不到拿破仑的一半。
拿破仑的优势在于他指挥的战斗数量很多。在他的 43 场战斗中，赢了 38 场，仅输了
5 场。拿破仑在 17 场战斗中攻克艰险取得胜利，在 5 场战斗中转败为胜。在战争数量
上，没有人可以与拿破仑匹敌。
拿破仑指挥了 43 场战斗，第二名罗伯特‧E‧李（Robert E. Lee），共指挥了 27 场战
斗（平均战斗场数为 1.5）。因为指挥战斗的次数多，拿破仑有更多的机会展示自己的实
力。亚历山大大帝虽然在总共的 9 场战斗中全部取胜，但由于他参战次数过少，时间较
短，取得的 WAR 也较低。
除了拿破仑这个例外，其他的将领的 WAR 都比较平均。这表明拿破仑的成功是因为其指
挥才能卓越，模型的结果没有问题。拿破仑的 WAR 与数据集中将领的平均 WAR 差距为
23。
数据观察：名声大不代表一定好
还有一些将领，他们虽然名声很大，但是 WAR 低的惊人。美国南方联盟的
司令罗伯特‧E‧李（Robert E. Lee）的 WAR 为-1.89，这表明处于平均水平的将领比
Lee 还要成功。Lee 处于不利地位，因为他军队规模和资源都有限。尽管如此，他也实
在称不上战略家这个称号。有些历史学家批评了他的作战战略和指挥关键战役的方式。他
的 WAR 证明这些历史学家的想法是对的。例如, 在葛底斯堡战役的最后一天，Lee 指挥
的“皮克特冲锋”真是一场灾难。用南卡罗来纳大学教授托马斯‧康利（Thomas
Connely）的话来说，“如果没有罗伯特‧李（Robert E. Lee），南方的情况可能不会那
么糟。
二战期间，德国陆军元帅欧文‧隆美尔（Erwin Rommel）因在北非的战役取得成功，绰号
“沙漠之狐”。在这个模型中，他的成绩也不佳，最终战绩为-1.953。这和近代将领，
包括诺曼‧施瓦茨科普夫和阿里尔‧沙龙，对隆美尔的赞誉不太一致。像 Lee 一样，隆
美尔一直是历史上颇有争议的人物。批评家认为他之所以被称作作战天才，主要是因为德
国和盟国的宣传。据报导，英国将领夸大隆美尔的作战能力是为了掩盖自己失败。
近代将领成绩差，因为参与数太低了
在模型中，近代将领的成绩相对较差。美国将军乔治‧S‧巴顿（George S. Patton）被
历史学家特里‧布莱顿（Terry Brighton）称作“二战中最伟大的将军”之一，而他也只
获得了 0.9WAR。近代将领的 WAR 较低可能是因为他们参加的战争数量较少。
二战后的将领中，以色列指挥官脱颖而出。以色列军方领导人摩西‧达扬获得了
2.109WAR（共指挥 60 场战斗）。他的 WAR 是近代将领中非常出色的，但与 20 世纪前
的将领相比，还是稍逊一筹。以色列前总理沙龙（Ariel Sharon）在苏伊士危机，六日战
争和赎罪日战争中取得胜利，因此获得了 2.171WAR（总指挥 58 场战斗）。
汉尼拔当年的评估：低估了自己，高估了对手
最后，我把汉尼拔对这些将领的评估与我的模型结果进行了比较。根据 WAR 值，汉尼拔
低估了自己的能力。汉尼拔的 WAR 最高，达到了 5.519（总计第六）。亚历山大大帝被
汉尼拔（Hannibal）排在第一。
在我的模型中，他稍逊于汉尼拔，获得了 4.391 WAR（总计第 10 位）。经历 9 场战斗
后，亚历山大就去世了，但他赢得了所有的战斗。汉尼拔共经历 17 次战斗，赢了 13 场
，输了 2 场，撤退 2 场。
因此，我和汉尼拔的评估是一致的，即虽然汉尼拔参与战斗更多，但亚历山大才是实至名
归的战术家，他展示了自己的作战能力。如果不是疾病，他可能会继续打胜仗。
然而，我的发现不同于汉尼拔对希腊将军 Pyrrhus of Epirus 的评估。在我的模特中，
Pyrrhus 只有 3 次战斗记录，得到了-0.53 WAR。虽然汉尼拔把创新的军事策略归功于
Pyrrhus ，但是无法证明 Pyrrhus 的策略一定能在战争中取胜。因此我对他的战术深表
怀疑。
我的模型可以更加有趣客观地评估各将领的作战能力。WAR 为以后的研究提供了范例，未
来的研究也可以通过扩大数据集和改进其他因素来改善这个模型。
基于读者的反馈，我想先明确自己的立场。首先，这篇文章的目的只是为了和大家分享一
个有趣的实验，而不是确定性的排名，也不是对军事历史的学术贡献。
此外，我的很多资料都来源于维基百科，因此我的模型存在漏洞。由于缺乏资源，数据可
能不是非常精确。
我相信绝大多数读者阅读这篇文章是出于对我实验的兴趣。感谢大家的支持和意见！
原文作者：Ethan Arsht

作者: reich3 (月涌大江流) 2016-01-01 00:22:00

普鲁士腓德烈大帝跟苏联朱可夫怎么没出现？？？？？？？

作者: colin1120 (SAN：13) 2016-01-01 04:22:00

怎么定义“一场战斗” 依照定义不同经历最多场战斗的指挥官可能会是某个东线的连、营指挥官或越战的队长或是某个空军or航空队指挥部的长官而又要怎么定义战斗的价值和战果的价值?盟军伤亡人数差异不大但迪耶普战役跟布雷斯特战役对盟军的意义难道会一样吗?

作者: asdf95 (Kç¥žæˆ‘å€‘å·´è¥¿è¦‹) 2016-01-01 06:11:00

各位的要求太高了，这不是要造出完美的比较好而是要找出可供使用的参数设计，这个尝试只能算是原型如果照各位的意见，是完全不能做出有意义的参数的而且战争本就有运气成份，好的决策品质是要去除掉运气成份让我们知道这个将领究竟是个人能力出众，还是运气好就跟股票市场当红的公司，不一定真的是经营者高竿，可能正好撞大运，让他一炮而红这种参数的用途是来评价决策，而不是比大小

作者: asdf95 (Kç¥žæˆ‘å€‘å·´è¥¿è¦‹) 2017-12-31 18:49:00

对这课题有兴趣的，可以找找上校赛局的研究

作者: Edison1174 (Edison) 2017-12-31 18:49:00

我还以为在打棒球还WAR咧那Win Shares怎么用？又不像棒球比赛每个球员跟联盟每个PLAY都有纪录

作者: asdf95 (Kç¥žæˆ‘å€‘å·´è¥¿è¦‹) 2017-12-31 18:52:00

这研究的方法不太好，经济学跟国关有相关的研究如何把运气的成份降低，得到较为贴近能力的评价

作者: Edison1174 (Edison) 2017-12-31 18:53:00

而且棒球基本上是在公平的场地用公平的规则竞争战场上可没有公平场地跟规则而且还忽视了后勤的重要性

作者: asdf95 (Kç¥žæˆ‘å€‘å·´è¥¿è¦‹) 2017-12-31 18:55:00

这课题有不少经济学家跟大数据公司投入喔因为这是改善决策品质的重要课题这篇只是方法用的还很原始，有更好的理论可以做这方面课题想法倒是不错的

作者: kira925 (1 2 3 4 疾风炭) 2017-12-31 18:58:00

WAR拿来分析不代表凑10个AR1的可以强过一个WAR10欧XD

作者: asdf95 (Kç¥žæˆ‘å€‘å·´è¥¿è¦‹) 2017-12-31 18:59:00

应该说不晓得有多少人知道这背后不是线性的？这个比较数字目标是得到较合理参数，用来更快速评价个人能力而不是拿来做线性推演的

作者: kira925 (1 2 3 4 疾风炭) 2017-12-31 19:05:00

最近MLB版还一篇文章分析了用WAR去估算薪水&交易决策可能会得到意想不到的结果也是说明WAR不能乱用

作者: asdf95 (Kç¥žæˆ‘å€‘å·´è¥¿è¦‹) 2017-12-31 19:07:00

这是拿来做决策品质改善，而不是用来乱套的因为薪水还有球员的市场价值等主观因素，不是单纯体现球员的能力

作者: kira925 (1 2 3 4 疾风炭) 2017-12-31 19:17:00

#1QBFzbGk (MLB) 纯粹题外话

作者: ejsizmmy (pigChu) 2017-12-31 19:18:00

Su22，有没有数据分析妳被飞弹射的资料xD(坏心)

作者: c22748872 (噜噜喵) 2017-12-31 19:55:00

不知道隆帅一战那些第一线指挥有没有列入阿

作者: kuma660224 (kuma660224) 2017-12-31 20:35:00

拿破仑之类不是单纯将领，而是国家元首。这让他们不用担心上级在增援或后勤上扯后腿

作者: qlz (()) 2017-12-31 20:56:00

棒球赛每一场的价值几乎是均等的(顶多就是季后赛国际赛略高于季赛?),但每场战争的价值绝对是不一样的...

作者: shiriri (CG屁屁妹) 2017-12-31 21:00:00

这种分析毫无意义因为进入战斗的条件天差地远

作者: MyohMy (我的天老爷呀！) 2017-12-31 21:06:00

亚历山大绝对不会只打9场，输在史官不给力 XD

作者: nawussica (暴民好弱 ) 2017-12-31 21:38:00

这个很好老美应该偷偷弄了很久

作者: k800i (K800i) 2017-12-31 21:51:00

GIGO一句话打死。数据库哪来的？维基......

作者: vandervaal (kensu) 2017-12-31 21:56:00

想看Su22被飞弹射的统计资料+1

作者: hazel0093 (heart-work.info) 2017-12-31 22:51:00

这个真得不好说有人会说以色列是靠垃圾阿拉伯人刷数据这篇只能算做是一种模型，把一些东西简化再简化不过拿皇是真的恐怖，真的可以说什么仗都打

作者: mtmmy (澳洲无尾熊) 2016-01-01 07:29:00

总得有个起头还不到二十年前 sabermetrics也常被说没意义

作者: katana89 (æœˆæœˆç«æ°´æœ¨é‡‘é‡‘) 2016-01-01 09:32:00

这点真的佩服美国人肯花时间研究会被吐槽有用吗的议题

作者: wittmann4213 (玄武岩) 2016-01-01 09:58:00

我觉得很有趣，但大概可预期作出的数字被批评没参考价值，不过能引起话题让人对军事史有兴趣就不错，搞不好还能出将军卡牌对战:出现吧，真·红眼蒙哥马利XD

作者: asdf95 (Kç¥žæˆ‘å€‘å·´è¥¿è¦‹) 2016-01-01 10:01:00

这很有用，只是这方法不好，经济学界跟政治学有更好套用的理论，不过这比较直观，不然用其他的方法，数学程度要不错

作者: kuma660224 (kuma660224) 2016-01-01 11:02:00

早期战争有完整纪录的资讯太有限也许21世纪大规模战争，能用AI大数据分析会产出较有可信性的数据排名。

作者: wittmann4213 (玄武岩) 2016-01-01 12:33:00

我是觉得这本身就不是作严格的学术性检视，只是用美国人习惯的棒球分析，会让一般人比较快代入

作者: btlin7806 (MOMO) 2016-01-01 15:01:00

有趣欸，推

作者: hgt (çŽ‹å¥‘èµ§) 2016-01-01 16:10:00

有没有加入东方将领?? 我觉得郭侃的WAR应该会爆表

作者: kuninaka 2016-01-01 16:44:00

陈庆之呢XD

作者: stu931134 (牛蛙) 2016-01-02 00:12:00

想法不错，只是模型有点粗糙，而且战事背后的影响往往比战事本身影响还大，还有太多要考量了

作者: thigefe (米麸) 2016-01-02 01:17:00

建好模型后,慢慢改良,才是学术的真谛

作者: LANCE1212 (LANCE1212) 2016-01-02 03:21:00

蛮有趣

作者: aa923310tw 2016-01-02 10:09:00

说了单纯有趣一下又有人认真？

作者: kira925 (1 2 3 4 疾风炭) 2016-01-02 11:33:00

这并不只是趣味一下的题目

作者: fw190a (las) 2016-01-02 14:36:00

让我想到Deadliest warrior的开场白

作者: Galm (水牛) 2016-01-02 16:15:00

挺酷的XD

作者: Rinehot 2016-01-03 08:29:00

WAR有个问题他是个累积的数据只要平均是正的打得越多WAR就会越高对MLB球员来说不是问题因为WAR本来就是看贡献度但是将领打仗的数量又不是他能决定的

作者: ejsizmmy (pigChu) 2016-01-05 05:32:00

那就改成打数？

作者: Bz5566 (只剩协志和仁甫的5566) 2016-01-08 09:28:00

Rinehot说的没错这模型把胜场看得比胜率还重要

继续阅读

[转载]R: 决战后置论与低速战舰无用论ejsizmmy Re: [转载]决战后置论与低速战舰无用论Oswyn Re: [问题] 间谍开图战unclefucka Re: [转载]决战后置论与低速战舰无用论leptoneta Re: [问题] 间谍开图战saltlake Re: [转载]决战后置论与低速战舰无用论karmapayes Re: [问题] 间谍开图战godivan Re: [问题] 间谍开图战hgt Re: [问题] 间谍开图战Hartmann [转录] 请问以前大家族要怎么管理财务？Reewalker