[问题] 用R分析健保资料

楼主: ecstasym (爱咳死在西)   2014-03-05 20:17:31
[问题类型]:
程式咨询
我想用R 分析健保资料,但是连要怎么用R 读资料都写不出来
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
老师丢了一笔健保教我用R试着分析 (老师自己是用SAS)
但我之前修过的课都没有教得太难
大部分是社区型的小资料
健保资料是很大的一笔 .DAT档案
内容超过 65万笔资料,约 40个变项
目前上网找过,也看过一两本R的书
但都没有写的很详细
目前知道read.delim()可以读进档案,但是根本乱码 XD
需要的帮助是希望高手们可以教教我怎么可以读这档案
或是有没有程式套件可用~
以上,希望各位帮帮小妹了
[关键字]:
健保资料
作者: obarisk (OSWALT)   2014-03-05 20:39:00
big5 utf8? 资料的分隔符号是? 关键字XD
楼主: ecstasym (爱咳死在西)   2014-03-05 21:03:00
请问资料的分隔符号要从哪里可以知道呢?
作者: gsuper (Logit(odds))   2014-03-05 21:04:00
你的问题应该不是R , 是要先找软件把 .dat 档换成 .txt档
楼主: ecstasym (爱咳死在西)   2014-03-05 21:34:00
http://ppt.cc/~3aa (资料用笔记本打开是长这样的@@所以我需要的是宣告第几个字符是哪个变量吗??
作者: kokolotl (nooooooooooo)   2014-03-05 22:19:00
你要先知道每个位置代表啥意思 去找资料的codebook吧
作者: diplazium (diplazium)   2014-03-06 09:24:00
何不直接请老师给你CSV档?
作者: onionsteven (.__ . )   2014-03-06 11:37:00
作者: braveht (冲吧冲吧)   2014-03-06 19:13:00
请安装RStudio,点右上角的import dataset...
作者: kokolotl (nooooooooooo)   2014-03-06 19:51:00
这样的资料型态我比较喜欢用stata来弄XD
作者: obarisk (OSWALT)   2014-03-06 23:15:00
看不出来资料长怎样
作者: summitstudio (第凡斯米德费尔德)   2014-03-07 17:28:00
跟老师要codebook里面有资料格式(健保资料是固定长度而不是用分隔符号这点比较麻烦,有codebook才作得动基本上一行(row)就是一个观察值 然后用长度去切字段或者懒人解法就是跟老师要已经读好的 SAS dataset xD
作者: anovachen (@@)   2014-03-11 15:34:00
substr()
作者: gsuper (Logit(odds))   2014-03-23 00:37:00
#1HLjk2HI 参考一下我这篇笔记文 花个10天学一下资料处理资料处理本来就是分析中相当耗时的部分 不太可能一键解决

Links booklink

Contact Us: admin [ a t ] ucptt.com