[分享] 简介数据(一)

楼主: KDDKDD (KDD)   2016-06-17 02:09:01
前言
  因为不少朋友反应想了解更多关于数据介绍,因此这篇将主要介绍常见棒球统计
数据名词(中职能算的)、公式或概念。本篇将分成以下架构介绍:
(1) 如何解读数据、常见数据概念。
(2) 个别介绍每一项数据,并尽可能附上算法和概念。
如何解读数据
  传统数据多多少少存在一些盲点,例如主观因素过重、比重不均、分析层面过于
粗略。为了解决这些问题出现了不少进阶数据,大致上解读数据可分以下几个想法:
(1) 累积型数据和平均型数据有所不同。累积型数据是指球员上场时间愈多成绩愈有
利,例如张正伟在2015年击出140只安打,这当然得有足够上场时间才能达成;
而平均型数据是指将累绩数据做进一步处理,例如张正伟2015年打击率0.335,经
过处理后的数据在样本数足够下才能一起比较,例如2015年张正伟打击率0.335,
王胜伟0.291。
(2) 样本数是否足够。当样本数过小时,数据容易失真或变动性过大,因此大多数数
据均要求一定量的样本数,对于样本要求各方标准不一,常见的是打者要求平均
每场3.1个打数,投手要求每场一局。若样本数不足时,建议看基础数据表现即可
或另取合理门槛。
(3) 进阶数据大多是经过回归分析而得到公式,其资料来源多数是以MLB过去资料为母
样本做分析,虽然不一定完全适用在中职上,但多数数据具有一定参考性。
(4) 进阶数据重视组距大于数字大小。这是解读进阶数据时大多数人的迷思,例如A球
员XR/27是6.12,B球员是6.37,解謮上会认为A和B球员是同一个等级,而不会说B
球员比A球员好,原因如同(3)所述,公式系数多数是经由回归得到的数字,只要
稍微改变一下变因就可能改变系数,因此以数字大小决定强弱是没有意义。
(5) 部份进阶数据是跟联盟平均或底层球员做比较,例如WAR、WS等等。
(6) 多数进阶数据数字愈高等级愈好,但也有少数数据是数字愈少愈好,通常以+号
表示前项,以-号表示后项。
(7) 贡献值和能力值并不相同。贡献值是指实际上球员提供多少成绩给球队,偏向结
论性质,通常上场时间愈多球员愈有机会提供更多贡献值;能力值较具预测性,
偏向理论性质,实务上可能因受伤、被其他球员卡位等因素而无足够时间和空间
,导致具高能力值选手却无法提供高贡献值。
(8) 虽然大多数进阶数据会尽可能去除(降低)主观因素,但仍然有可能会有缺陷,
评断球员前建议多观察几项数据。
作者: lakersPOYU (poyu)   2016-06-17 02:11:00
推 半夜优文
作者: Mr23 (瓦旦)   2016-06-17 02:19:00
作者: joanwinnie (维尼尼)   2016-06-17 02:20:00
推推
作者: Go2 (勾兔)   2016-06-17 02:20:00
先推再看
作者: bosswu1001 (黄色加油棒)   2016-06-17 02:27:00
优~
作者: tfoxboy (香蕉大象皇)   2016-06-17 02:31:00
作者: jeng0326 (阿政)   2016-06-17 06:50:00
作者: dtn (dartagnan)   2016-06-17 07:15:00
只能推
作者: NRS (人间自转车)   2016-06-17 07:25:00
推优文
作者: jhja5566 (jhja5566)   2016-06-17 07:47:00
作者: joey1149 (Joey)   2016-06-17 08:17:00
作者: decadentchi (77)   2016-06-17 08:43:00
推~
作者: rain0212 (淋雨)   2016-06-17 08:47:00
作者: yankeerock (yankeerock)   2016-06-17 08:53:00
kdd大还是没说过id和kdd conference有没有关系
作者: poweroo2001 (昇昇不息)   2016-06-17 09:12:00
大推
作者: ddik32 (睡觉睡到饱)   2016-06-17 09:14:00
推数据分析优文
作者: candlelit (呀呼~)   2016-06-17 09:29:00
作者: tawi (0.0)   2016-06-17 10:20:00
KDD太神
作者: joreny7269 (joreny)   2016-06-17 10:55:00
推推
作者: kotchman (111)   2016-06-17 11:51:00
大推KDD
作者: ianchen1997 (Eating)   2016-06-17 11:53:00

Links booklink

Contact Us: admin [ a t ] ucptt.com