[问题] 在资料中新增一个变量来进行统计分析

楼主: swilly0906 (史威利哥哥)   2016-08-12 02:16:56
[问题类型]:
新手(没写过程式,R 是我的第一次)
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
拍谢拍谢 其实我真的不清楚标题要怎么打比较好
我的问题及如下:
这是我资料的前10笔
年 性别 ......(其他变量)
100 F
101 M
100 F
102 M
103 M
101 M
102 F
104 M
104 F
102 M
.
.
.
.
.
(约2w笔)
我先讲 我的目的:我希望可以算出各年(资料仅有100~104年而已)的男女生的
某变量统计量
所以就是说 我想要跑出一个表格
列:100年男,100年女,101年男.....,104年女(共10个)
行:meadian,mean,sd,skewness....(一些统计量而已)
所以我想到了一个方法(因为我只能想到这招 有更好的请教我一下 感恩QQ)
第一步骤:我先创造一个新变量叫做"yearsex"
然后我希望把"100年男,100年女,....,104年女" 分别用1~10代表
我以我上面的资料例子为例yearsex=c(2,3,2,5,7,3,6,9,10,5)
然后再用cbind并入我的原资料
:第二步骤:接着我再用sapply(unique(yearsex),function(x){........})
就大功告成了
其实step2我没问题啦,反而我想问step1怎么做呀???????(还是有其他比这2个步骤更好的)
作者: clickhere (It's time to go home.)   2016-08-12 03:56:00
try unique
作者: carl090105 (Jing)   2016-08-12 07:19:00
若是有时间的话,建议学习一下dplyr套件 有助于资料方面的处理第一个用group_by然后summarise_all或summarise_at第二个可使用distinct,by the way 需要注意的是dplyr版本方面的问题0.5.0版本有做了不少更动
楼主: swilly0906 (史威利哥哥)   2016-08-12 09:10:00
先感恩 我先去学习 研究看看@@

Links booklink

Contact Us: admin [ a t ] ucptt.com