Re: [问题] 想用R写一个统计回归分析的程式

楼主: allen1985 (我要低调 拯救形象)   2015-11-22 10:04:28
首先 这标题可能有误 我的理解这问题跟回归没有关系
如果我的理解没有错
题目是: 现在有一组资料是10条绳子的长度
那么想了解绳子的长度应该是什么统计分配呢
是不是常态分配 or 指数分配 or Poisson分配
我猜 原po想做的事情是 随机产生10组数据从上述的分配
然后看看是否跟绳子长度的分配一样
如果到这边 我的理解还是对的 原po可以往下看
1. 请先了解生成随机变量的指令 请google一下
例如 rnorm(10,10,90) 跟你的叙述差距很大很大
只有第一个10是对的 产生10笔资料
还有 dunif 跟 runif 的差别等等 总之 三个指令都误用了
2. 回到问题 如果没有学过很多检定方式 例如 Kolmogorov–Smirnov test
建议的做法是 画直方图 如果某一组随机生成的数据 长相跟绳子长度类似
那么我想你就接近答案了
3. 跟第一点相关 产生随机变量的指令 有些参数需要输入
一个简单的做法 利用资料去算出这些参数
例如 sample mean and sample variance
其实 在算出这些值之后 也可以利用这些值删除某些不太可能的分配
举例来说 Poisson distribution 的特性是什么 mean = variance?
4. 最后 想要做任何分析之前 请把统计课本再拿出来翻一下
了解一下其意义 再来实际做分析
就我看来 T-test 回归 在这里毫无用处 不知道为什么你会提到
===========================分隔线========================
Sorry 这篇回文跟R没什么关系
小弟我实在不敢在这版上回R相关指令问题
版上神人太多了
如果版主觉得不适合 可以删文
谢谢
※ 引述《eegame (yu)》之铭言:
: 初学者(两个月) R是第一个程式语言
: 不知道各位前辈有没做过类似的程式
: !!!假设!!!
: 想用R统计10条绳子的长度
: 再根据统计特性的率随机产生10组数据
: 程式如下
: G <- 10 #10组数据
: rowname <- c(1:G) #Y轴名称
: colname <- c("c1","c2","c3","c4") #X轴名称
: F <- matrix(,nrow=G,ncol=4,dimnames=list(rowname,colname))?
: #开一个10*4的矩阵并以rowname和colname
: F[1,"c1"] <- 19
: F[2,"c1"] <- 59
: F[3,"c1"] <- 48
: F[4,"c1"] <- 23
: F[5,"c1"] <- 31
: F[6,"c1"] <- 48
: F[7,"c1"] <- 56
: F[8,"c1"] <- 60
: F[9,"c1"] <- 74
: F[10,"c1"] <- 83
: #在矩阵c1的位置放入这10条绳子的调查数据
: #假设1符合常态分布
: F[,"c2"] <- rnorm(10,10,90)?
: #在矩阵c2的位置放入根据常态分布的机率随机产生一组新的数据介于10~90之间的10笔数
: 据
: #假设2符合均匀分布
: F[,"c3"] <- dunif(10,10,90)
: #在矩阵c3的位置放入根据均匀分布的机率随机产生一组新的数据介于10~90之间的10笔数
: 据
: #假设3符合Poisson distribution分布
: F[,"c4"] <- dpois(10, lambda=1)
: #在矩阵c4的位置放入根据Poisson distribution分布的机率随机产生一组新的数据介于1
: 0~90之间的10笔数据
: #结果如下
: F
: c1 c2 c3 c4
: 1? 19 -70.255568 0.0125 1.013777e-07
: 2? 59 9.346476 0.0125 1.013777e-07
: 3? 48? -2.139539 0.0125 1.013777e-07
: 4? 23 -33.231206 0.0125 1.013777e-07
: 5? 31? 72.630937 0.0125 1.013777e-07
: 6? 48? -6.032507 0.0125 1.013777e-07
: 7? 56? -8.420308 0.0125 1.013777e-07
: 8? 60 -69.542557 0.0125 1.013777e-07
: 9? 74? 12.044775 0.0125 1.013777e-07
: 10 83 -13.474063 0.0125 1.013777e-07
: 问题1.我函数的指令是不是给的不对导致c2 c3 c4的结果错误?
: 问题2.关于随机分布的应用 如何做到根据统计特性产生结果?
: 问题3.关于数据统计特性如何检定比较符合 常态分布 均匀分布 负指数分布等等的分布
: 特性? 是用卡方检定 T-test检定? 还是用数值回归???
: 这两个月没有看到类似的文章
: 麻烦各位前辈指点迷津
: 拜托 拜托
作者: celestialgod (天)   2015-11-22 13:44:00
好人,推
作者: eegame (yu)   2015-11-22 14:06:00
所以不用做卡方检定!!! 而是要先算出数据的平均数 中位数等等 然后怎么做判别???
作者: celestialgod (天)   2015-11-22 14:10:00
我比较想建议原po把统计学学清楚比较重要...连我问题都不一一回复,我实在不知道怎么帮这实在不太是求学问的方式,像是在要答案
作者: eegame (yu)   2015-11-22 15:28:00
对不起我以为我回答了
楼主: allen1985 (我要低调 拯救形象)   2015-11-22 15:36:00
请问你做卡方检定做什么?在做每个统计分析前 请先思考一下为什么这么做麻烦你回答一下 卡方检定是用来检定什么的
作者: celestialgod (天)   2015-11-22 15:38:00
所以常态的两个参数意义?卜瓦松的参数意义?你都没有回答到阿....我说原po
楼主: allen1985 (我要低调 拯救形象)   2015-11-22 15:42:00
我懂 呵呵 C大辛苦了
作者: celestialgod (天)   2015-11-22 15:45:00
a大辛苦了,还回那么一大篇...
楼主: allen1985 (我要低调 拯救形象)   2015-11-22 15:51:00
难得在R版上 看到我看得懂的东西...就回一下
作者: celestialgod (天)   2015-11-22 16:14:00
而且卡方检定只是统称 最后检定统计量是卡方的检定应该要适度标明使用的是哪一种检定
作者: eegame (yu)   2015-11-22 17:20:00
我整理一下讯息 1.先将资料整理出图看分布情况 2.比对资料分布与哪一种分布特性相近 3.至于检定是用在事件成不成立 不知道目前这样的方式对不对 之前以为检定是用来找分布特性的 非常抱歉我目前还是不懂函数中各参数的意思

Links booklink

Contact Us: admin [ a t ] ucptt.com