[问题] 用 R 做卡方检测

楼主: peter0726 (江 谢)   2017-04-19 11:04:15
[问题类型]: 程式咨询
[软件熟悉度]: 入门
主要用 perl 处理资料,偶尔用R作分析
[问题叙述]:
我现在有两笔资料要比较其组成比例有没有差异
问过其他人后知道要用卡方
资料大致上长这样
要比较 A、T、C、G 的组成在 A 跟 B 之间是否有差异
A T C G
SampleA 1937 373 14788 238
sampleB 2590 395 17686 274
想请问一下要怎么在R上面做到卡方检定?
目前 google 查到的方法是这样
a <- c(1937,373,14788,238)
b <- c(2590,395,17686,274)
chisq.test(rbind(a,b))
在上面列出来case时结果跟我在网络上找到的计算器结果相同
(http://www.socscistatistics.com/tests/chisquare2/Default2.aspx)
可是到了另一个 case
A T C G
SampleA 1595826 308 450 76
sampleB 1576617 362 428 59
上面的写法跑出来的p-value是 0.06327
可是计算器上给的结果是 The p-value is < 0.00001
想请问一下正确的做法是怎么样
[环境叙述]:
R version 3.3.2 (2016-10-31)
Platform: x86_64-redhat-linux-gnu (64-bit)
Running under: CentOS release 6.7 (Final)
locale:
[1] C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
作者: clansoda (小笨)   2017-04-19 11:19:00
把所有资料弄成一个table 然后chisq.test()
作者: dumb0101 (无)   2017-04-19 11:58:00
参数Correction不用默认看看?
作者: fred1541 ((没意义))   2017-04-21 09:39:00
那是生物DNA?
作者: Steven87 (Bogi)   2017-04-21 12:14:00
对table直接summary会自动帮你做卡方检定

Links booklink

Contact Us: admin [ a t ] ucptt.com