[问题] 不干净的资料汇入、如何处理?

楼主: paranoia5201 (迈向研究生)   2018-03-05 17:56:35
※ [本文转录自 Statistics 看板 #1QdHGr4X ]
作者: paranoia5201 (社会黑暗、行路难) 看板: Statistics
标题: [问题] 不干净的资料汇入、如何处理?
时间: Mon Mar 5 17:56:03 2018
各位好:
这里想要请教、如果拿到的原始档不是很漂亮、该要怎么汇入处理?
我直接面对的例子是死因统计年报(下载:dep.mohw.gov.tw/DOS/lp-3352-113.html)
打开档案后会发现它每个分页的头几列都是各式主标题与子标题。
我该如何处理这部分、好让它可以在汇入之后做运算整理呢?
感谢~
(预计使用的软件为R、Python、还有SAS)
作者: celestialgod (天)   2018-03-05 18:44:00
readxl::read_excel会帮你读成table格式
作者: andrew43 (讨厌有好心推文后删文者)   2018-03-05 18:52:00
处理试算表的package大多可以按分页读入读入后就是各别对付了,没什么法门。
作者: seimwiwa (pezcadido)   2018-03-06 23:25:00
卫福部有全死因档从那个资料再整理出来比较快(吧)
作者: wayturn (岳)   2018-03-07 12:25:00
想问R有套件能处理主副标吗?还是只能手动处理excel再汇入
作者: andrew43 (讨厌有好心推文后删文者)   2018-03-07 19:22:00
读入的function常有前几列不读的参数,可帮点忙

Links booklink

Contact Us: admin [ a t ] ucptt.com