[问题] 制作表格

楼主: EricTao   2015-02-02 01:43:56
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
我有一个data frame,想要做成类似这样的表格 http://ppt.cc/nJZr 图一
而data frame如图中的右半边 http://ppt.cc/wauk
问题1. 如何为这样的表格建立dara frame?
原本想用by或是apply之类搭配自己写函数,用函数判断,什么型态的字段要做什么统计
但是by丢进函数的lists好像还是要用for loop处理。
这样好像干脆直接写loop 一个个column去统计就好了。(by还是有分组的功能就是了)
还是R中有比较好的方法可以写?
问题2. data中的那些值为1/0的字段,其实是代表boolean的T/F,在R中好像不能混用?
因为这个data之后会丢去做glm。
请问我该怎么转换型态? 或者,在写CSV档时怎么表示boolean值给R来读?
抱歉这次的问题有点乱,想不到怎么问比较有条理。
作者: andrew43 (讨厌有好心推文后删文者)   2015-02-02 01:53:00
在R中0/1和F/T是通用的。像是做逻辑式回归,0/1即可。我认为你原本的资料是洽当的。要再做各别的描述只要按二个组切开分别分析就可以了。但如果要一键完成,大概还是要自己写。我想到的也是用for loop走每一栏,然后用tapply进行。
楼主: EricTao   2015-02-02 02:18:00
感谢,请问若我直接写函式来loop,为何需要tapply呢?我以为for loop可以直接处理,原来不行吗@@
作者: celestialgod (天)   2015-02-03 13:14:00
给partital data 给你写的程式码 再来讨论比较好资料不同 怎样整理比较快也不同
作者: andrew43 (讨厌有好心推文后删文者)   2015-02-07 17:06:00
用栏名(即变量名)来判断会不会方便一些?如果纯靠资料内容来判断,似乎比较困难。不过这都视你未来会丢进什么资料而定。
楼主: EricTao   2015-02-07 22:22:00
对阿 目前是靠字段名判断 想顺便练习看看就是XD
作者: andrew43 (讨厌有好心推文后删文者)   2015-02-07 23:14:00
length(table(x)) 如果等于 2 可以猜测为binary。

Links booklink

Contact Us: admin [ a t ] ucptt.com