晚上再来一次回完
先说昨天那个很厉害的投手
来个不同状况下的球种比例表
http://imgur.com/BNbry1W
不同状况下的球数比例表
http://imgur.com/BELD4WF
各球种及位置分布图
http://imgur.com/Vhh8Yqr
再来那个很厉害的左打
各位置的打击热区图
http://imgur.com/ubeMYJN
细分对右投54个打席的全球种落点图
http://imgur.com/dGCXd3G
对左投41个打席的全球种落点图
http://imgur.com/gU2ieZm
基本整个数据分析工作,大概可以分成几个部分
设计系统、做纪录、看报表、写结论
如有需要可以从记录字段引申一些其他功能
一般人可能以为纪录完就好了
当然不是,我的确纪录完可以马上跑出报表
报表里头自然就是依据各方请教,了解教练球员的思维
所设计的一些图表
一个球员的报表,大概会跑成5-6张PDF
为何不用系统来查询?
因为资料太多了,比赛中又不能查
所以印出来翻比较方便
一个球员5-6页,代表一队将近要100页
教练球员要比赛、要训练,还有每天搭车移动
说实在四队看完球季都结束了
所以就需要有"数据分析师"这种人
每天就看这些报表,有无特殊有趣的数据可以提供给教练团
大约一个球员,1-2句话就很多了
太多干涉我也觉得没意义,不用这么爱刷存在感啦
球又不是我在打的,拿冠军我也喷不到香槟
还有也许看了看,会想到其他的逻辑
例如我最近在研究的投手第一轮、第二轮、第三轮的配球差异
然后再拉出原数据库,再试跑看我这个假设是否有显著的差异性
如果真的有,就考虑写进自动跑出的报表
然后报表又会再多几页了......
球团常觉得我太贵
应该是以为工作不过就是写系统、做纪录
而没有考虑到"数据分析师",把很多的资料萃取成最后两句话要花多少精神
当然这也不用勉强第一线的球团人员
他们真的很辛苦,要承受各方压力
还要从有限的预算中来想办法,我至今都还蛮感谢他们的
中午爆掉那篇
个人经验是提出讨论,教练团都会很乐意提供意见
可是球团是付钱的人,球队是比赛的,基本不太经手钱的事情
那位朋友当时没签约没错,有无提过费用?
以我的了解,球团人员应该不是会赖帐的(虽然我最后没有谈成XD)
毕竟赖了也不会进自己口袋,大家都是领薪水的,干嘛这样呢?
有人问纪录可否自动化、或是阿发狗那些
美国的状况,印象中是每一支球团给大联盟官方一千万美金,是每一球团喔
让大联盟官方找厂商在每一个球场装一些硬件
然后收集下来的资料提供给各球团
好像只是提供,要怎么分析看你自己,要放旁边不用也行。但钱还是要付
以上是我听来的第N手资讯
感谢提醒,上面的金额是错的
他会收集球员、球等等的移动数据
这种"数字"上的资料,当然可以自动化。就像测速枪一样
但是"属性"上的资料,就还是需要人来填
例如好坏球
好坏球他的系统绝对可以帮你判,还判得非常准,问题好坏球又不是机器决定的
还是你要在主审右手上装sensor? 那这样绝对可以自动化
当然,厉害的系统可以把一些属性资料用逻辑来帮忙填写
就可以让纪录系统减少一点人工
但考量目前的经费问题,还是多以人肉纪录为主
机器可以模拟总教练的思维,告诉你要怎么打吗?
我个人认为是不行
不过猜猜对手战术思考模式,例如提前离垒、短打、甚至pitchout等
我是有在思考怎么呈现啦
要跑出来一定有,问题在于若不够显著,就不用囉嗦
因为下棋,你要棋子放在哪里,他就在那里
投球打球没有那么准的好吗
不要说台湾,日职投手参加九宫格挑战,有几个可以全破的?
挥棒也是阿,也许打者前一打席被挤到,刚好手痛挥棒轨迹跑掉
然后蒙出小安打。这要杀机器的头谢罪吗??
我还是认为,球是球员在打的,数据只是辅助,不用太自以为是
另外S大纳篇我也有思考过一些
数据资料能提供多少,有没有让教练们觉得地盘被占
以我接触的状况来说,他们是可以接受一些新思维的啦
不过我觉得要分几个层面来说
技术面、情报面、战术面、战略面
技术面部分
用膝盖想也知道我来讲一定没人鸟
我人生球速最快的时候,大概跟他门国小时差不多
所以这部分绝对不用插手
情报面
如果提供的是在什么状况下,对手什么行为机率高这种
他们会很乐意了解,也就是我目前最主要提供的资讯
战术面
例如要不要闪这个,拼下一个这种
我认为不用去插手
毕竟总不可能像支小蜜蜂在总教练旁边
然后随时叽叽喳喳一直在那炒吧
战术这种,本来就是拼赢的大声
就算是蒙到的也算数
我之道联盟纪录都有提供对战组合
假设某A打者对战七之一,要拼他,还是对下一个对战八之三的?
用膝盖想都觉得是拼七之一对吧
但是联盟的资料记得是"打席结果"
如果有两颗是打到警戒区被接杀,抱歉这也算是那六次失败记录喔..
这就是用纪录来分析的盲点,也就是用数据分析的优势
战略面
例如选秀、补强那些
首先这些的资料,不是我阿宅看转播就能作的
如果真的要作
也要大家先了解一些参数的设定、字段得确认之类
再依一些逻辑来订定标准
总之,数据能作的不少
但以目前来说,毕竟我们只是个小咖团队
讲太多也没有人信,所以首要应该是以情报面为主
也许顺利的话,再慢慢扩充到其他方面吧