Re: [问题] 登革热

楼主: simonjen (狂)   2019-06-09 01:38:12
推 ********* : 希望别像前几年一样严重 06/08 23:47
这件事情我想需要解释一下,不过这之前我们先来看一下数据资讯:
以下是这20年左右的数据:
1998 1999 2000 2001 2002 2003 2004 2005 2006
110 40 4 228 4813 77 60 144 956
2007 2008 2009 2010 2011 2012 2013 2014 2015
202 443 782 1099 1182 531 584 15058 19830
2016 2017 2018
318 37 56
以上是每个年度与登革热的数据关系,基本上个人对于数据算是有一点兴趣,
所以就做了一下分析,基本上我们可以去看这1998~2018的平均值与标准差:
平均值 2216.857143 标准差 5220.755283 中位数 318
偏态系数 1.091139331
基本上这是右偏的一个数据,也就是说多数的状况之下是偏少,
不过常态分配比较容易来看,所以我们就假定是常态分配的结果
(其实是我懒得查换算系数表),
从机率来说2014年大概是2.4个标准差,也就是发生的机率小于2.5%,
再来看2015年的差距大概是3.3个标准差,也就是发生的机率会小于0.05%
如果回归回来看这图其实右偏态所以这些机率还会比常态分布更小。
再回来看2016之后的数据位置结果:
2016 -0.3637131104 2017 -0.4175367403 2018 -0.4138974201
从常态分配的统计来说,这发生的机率大概是75%左右(右偏态所以会更接近这个值)
由上述的结果其实我们可以了解到2014和2015基本上在实验上应该算是很大的误差值,
那如果我们把数据拉回到只统计1998~2013年(基本上就是做子体分析)
那就会获得以下数据:
平均值 703.4375 标准差 1127.336461 中位数 335.5
偏态系数 0.9791331499 不意外个往常态分配靠进了,
不过为了方便还是先以常态分配的结果来看2014和2015的状况,
2014年 12.73316618个标准差 2015年 16.96615266个标准差,
这值发生的机率小于10^(-9)%,在回来看2016年之后的数据:
2016 -0.3419010325 2017 -0.5911611334 2018 -0.5743072476
这些发生的机率也都大于50%,也就是说2016年之后就又回归到2013年前的数据状态,
至于为什么2014和2015发生了什么事情,造成登革热大爆发呢?
我想这都有讨论的空间,不过从数据上来看2014和2015基本上就是很特别的值,
如果你想讨论常态结果用2014和2015来讨论基本上就是一个谬误,
以下我们就来举个例子来看这到底是多奇怪的谬误:
假定你平常站在体重机上是75KG,大概每天量就是73~77这样在跑,
但是有一天你站在体重机上发现到你的体重是99KG,请问你当下是反应自己变胖了?
还是反应这体重计有问题?
以上就是很简单的数据分析结果,如果想更仔细其实需要更多的资讯。
如果你问我个人的意见,我目前查起来最大的差异在于"气爆"......。
不过如果你是担心是否2014和2015会不会重演?我个人认为是不太可能啦!
机率分布的结果就是这样,不过大家还是要多多留意自己的身体健康。
迟了两天,端午节快乐。
作者: siekensou000 (小胖宅)   2019-06-09 02:40:00
是...端午节
作者: LeMirage2000 (幻象高高飞)   2019-06-09 08:17:00
统计学开课XD
作者: SacrificesPi (一枚弃子)   2019-06-09 13:12:00
不明觉厉

Links booklink

Contact Us: admin [ a t ] ucptt.com