[问题] t检定之t值相同p值不同问题请益

楼主: lapavoni (lapavoni)   2015-06-01 10:33:53
文章分类提示:
- 问题: 当你想要问问题时,请使用这个类别
[问题类型]:
经验咨询(我觉得我的t检定是不是出问题了...)
[软件熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
目前在处理一份问卷分析,受试者目前依性别分为两个Group(两组人数不同),
题目作答类型为五点计分,其中有两题的t检定跑出来的结果t值都是-2.0,但
是两个p值差很多,一个有显著,另一个则没有,还有它df的算法我也不太懂...
[程式范例]:
======================================================================
第八题的两组作答资料为:
> gb8
[1] 4 3 2 2 4 3 4 3 3 2 3 4 2 1 4 2 3 4 2 3 1 2 3 3 4 3 2 2 2 3 2 2 3 3 2 2 1 3 4 4 3 3 4 3 4 3 3 2 3 4 3 3 2 4 4 4 3 3 3 4 2 4 3 2 2 2 3 2 3
[70] 3 3 2 3 3 3 4 2 3 4 3 4 3 3 3 3 3 3 2 3 3 4 3 3 3 4 2 3 2 4 2 3 3 3 4 4 4 3 2 3 3 3 3 3 2 3 3 3 3 3 3 3 3 2 3 3 3 1 4 2 3 3 3 3 3 3 2 2 3
[139] 4 2 2 3 2 1 2 3 2 3 2 4 2 2 3 3 2 3 3 3 4 2 4 1 3 3 3 1 3 3 3 3 2 3 2 3 3 4 3 3 4 3 3 3 3 4 3 2 3 3 3 3 2 4 3 3 3 3 3 3 2 3 3 3 3 2 2 3 4
[208] 3 3 2 2 2 1 1 4 2 3 4 2 3 2 3 4 3 2 3 3 4 3 2 3 3 3 4 2 2 3 2 3 3 3 4 4 3 3 3 3 1 2 3 3 3 3 4 4 3 3 3 3 3 3 3 4 2 3 3 3 4 3 2 3 3 3 3 3 3
[277] 3 2 3 3 3 3 3 3 3 3 4 2 2 3 3 4 3 3 3 3 4 3 3 2 4 3 2 2 2 3 3 4 3 4 3 2 1 1 3 3 3 1 3 3 3 3 2 3 3 3 2 3 4 4 4 4 3 3 4 4 3 2 1 3 3 4 3 3 3
[346] 3 3 3 3 2 4 4 3 3 3 4 3 3 3 3 3 2 3 3 1 3 3 3 3 3 3 3 3 2 2 3 4 3 2 3 4 3 3 3 2 3 3 3 3 3 3 3 3 2 3 4 3 4 2 4 4 3 2 3 3 3 3 2 3 2 2 4 2 3
[415] 3 4 4 4 3 3 3 3 3 2 4 3 4 3 3 3 4 4 4 3 3 3 2 3 3 3 2
> sb8
[1] 3 2 2 3 3 3 3 3 3 3 3 3 2 3 4 3 4 2 3 3 4 4 2 3 4 3 3 3 2 2 2 3 3 4 2 4 3 3 3 3 3 2 3 4 3 3 4 4 4 3 3 3 2 3 4 3 3 4 3 4 3 4 3 2 3 3 3 3 3
[70] 3 3 2 3 3 3 2 3 3 3 4 3 3 3
t检定的结果为(两组变异数有显著差异)
> t.test(gb8,sb8,var.equal = FALSE)
Welch Two Sample t-test
data: gb8 and sb8
t = -2, df = 100, p-value = 0.1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.2691 0.0259
sample estimates:
mean of x mean of y
2.90 3.02
=========================================================================
第9题的两组资料为
> gb9
[1] 4 3 2 2 3 3 4 3 3 2 3 4 2 1 3 2 4 4 2 3 2 3 3 3 3 2 3 2 2 3 2 3 3 3 2 1 1 3 3 4 3 3 3 3 4 3 3 2 3 3 3 3 3 4 3 4 3 3 3 2 2 4 3 2 2 2 2 4 2
[70] 3 3 2 3 2 3 4 2 3 3 3 4 3 3 3 3 3 3 2 3 3 4 3 3 3 4 2 3 2 3 3 3 3 2 4 4 4 2 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 2 3 3 1 4 2 3 3 3 3 3 3 2 2 3
[139] 4 2 2 3 2 2 2 2 3 4 3 4 2 2 3 3 2 3 3 3 4 2 4 1 3 2 2 2 3 3 3 2 2 3 2 3 3 4 3 3 4 3 3 3 3 4 4 2 3 3 3 3 2 3 3 3 2 3 3 3 2 3 4 3 3 2 2 3 3
[208] 3 3 2 2 2 3 2 3 2 3 3 2 3 2 3 3 3 3 3 3 4 3 2 3 3 3 4 3 3 2 2 3 3 3 4 4 3 3 3 3 2 3 3 3 2 3 4 4 4 2 4 2 3 3 2 4 3 3 3 2 4 3 3 4 3 3 3 2 2
[277] 3 2 2 3 3 3 3 3 3 3 3 3 2 3 3 4 3 3 2 3 4 3 2 3 4 3 2 3 2 3 3 4 3 3 3 2 1 2 3 3 3 1 3 3 3 2 2 3 3 3 2 3 4 4 4 4 3 3 4 3 3 2 3 3 3 4 3 3 4
[346] 3 3 3 3 2 3 4 3 3 4 2 3 3 3 3 3 2 3 3 1 2 3 2 3 3 3 3 3 2 2 3 4 3 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 3 3 3 4 2 3 4 2 2 3 3 2 3 2 3 2 2 4 3 3
[415] 3 4 3 4 3 3 3 3 3 3 3 3 4 3 3 3 4 4 3 3 3 3 2 3 3 3 2
> sb9
[1] 3 2 3 2 3 3 3 3 4 3 2 3 3 3 4 3 4 2 3 3 4 4 2 3 3 3 4 3 2 3 3 3 3 4 3 4 3 3 3 3 3 3 3 4 3 3 4 3 2 3 3 3 2 2 4 3 3 4 3 4 3 4 2 2 3 3 3 3 3
[70] 3 3 3 3 3 3 2 3 3 3 4 3 3 3
t检定结果为
> t.test(gb9,sb9,var.equal = FALSE)
Welch Two Sample t-test
data: gb9 and sb9
t = -2, df = 100, p-value = 0.02
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.3043 -0.0265
sample estimates:
mean of x mean of y
2.87 3.04
=======================================================================
想请问一下,我该如何解释这样的结果,一般状况下p值不是由t值和df值推出来的吗?
另,那个df=100又是如何算出来的呢?
[环境叙述]:
R version 3.2.0 (2015-04-16)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: OS X 10.9.5 (Mavericks)
locale:
[1] zh_TW.UTF-8/zh_TW.UTF-8/zh_TW.UTF-8/C/zh_TW.UTF-8/zh_TW.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] epicalc_2.15.1.0 nnet_7.3-9 MASS_7.3-40 survival_2.38-1 foreign_0.8-63 gplots_2.16.0 plyr_1.8.2 reshape2_1.4.1
[9] xlsx_0.5.7 xlsxjars_0.6.1 rJava_0.9-6 ggplot2_1.0.1 questionr_0.4.3
loaded via a namespace (and not attached):
[1] Rcpp_0.11.5 highr_0.5 bitops_1.0-6 class_7.3-12 tools_3.2.0 digest_0.6.8 gtable_0.1.2
[8] shiny_0.11.1 proto_0.3-10 e1071_1.6-4 stringr_0.6.2 gtools_3.4.2 caTools_1.17.1 classInt_0.1-22
[15] grid_3.2.0 R6_2.0.1 RJSONIO_1.3-0 gdata_2.16.1 scales_0.2.4 htmltools_0.2.6 splines_3.2.0
[22] mime_0.3 xtable_1.7-4 colorspace_1.2-6 httpuv_1.3.2 KernSmooth_2.23-14 munsell_0.4.2
>
[关键字]: t-test
选择性,也许未来有用
作者: allen1985 (我要低调 拯救形象)   2015-06-01 12:22:00
自由度不一样? Google 一下公式
作者: b10009047 (Nicklee)   2015-06-01 12:24:00
自由度的部分, google t-test wiki中有个变异数不相等的情况下, 有个公式用来算自由度的, 可能是那个p.value由定义看若检定统计量和自由度一样, 应该要相等唯一想的到的只有t值后面小数点是不是被舍去了
作者: allen1985 (我要低调 拯救形象)   2015-06-01 12:39:00
自由度一样 刚刚没仔细看完 可以upload你的data吗By the way 这资料可能不太适合用t-test
作者: andrew43 (讨厌有好心推文后删文者)   2015-06-01 14:06:00
t.test(...)$statistic 看看t值是不是相同。
作者: allen1985 (我要低调 拯救形象)   2015-06-01 14:44:00
t值 跟 df值(此条件下) 没有特别设定 通常不会是整数
楼主: lapavoni (lapavoni)   2015-06-01 15:58:00
先感谢各楼回答,手机回应有些限制,回家后以电脑完整回复经由b10009047,allen1985两位的提示,原PO再回家检查了一次程式,证实是很前面的小数点控制影响到t值,造成大家的困扰,原PO在此谢罪 XD

Links booklink

Contact Us: admin [ a t ] ucptt.com