[软件程式类别]:
R
[程式问题]:
资料处理,找出重复次数最多
[软件熟悉度]:
学习约两个月
[问题叙述]:
读取健保数据库,共有40个字段。其中第14个字段看诊科别与第20个疾病种类,我想要
查询数量最多的前10名(总共有11万笔看诊资料)
数据库读出来的程式命名data1
除了直接用data1[,14]与data2[,20]取出两个需求的字段外
也有试着用data3[,c("FUNC_TYPE","ICD9CM_1")] #第14字段名为FUNC_TYPE, 第20字段名
ICD9CM_1。这个方式直接取出两组需要计算的字段。
有找到书籍跟网络上的资讯,是不是要用dplyr套件内的group_by跟summarise两个函数
比较容易找出来看科别与疾病的钱前10名?