[问题] table问题(网页编码)

楼主: vicror84 (阿汘)   2016-06-05 20:23:26
请问我想把亚东健检中心(http://depart.femh.org.tw/HMC/wholebody.html)的表格爬下
来,但会出现乱码在windows系统中,使用R语言,抓取表格呈现出乱码,
我们将格式转为繁体,
还是会呈现乱码,我们研究出所有BIG5编码的网页,转换后,还是乱码,
程式如下:
library(XML)
URL = paste0("http://depart.femh.org.tw/HMC/wholebody.html")
doc<-htmlParse(URL,encoding="UTF-8")
tables<-readHTMLTable(doc,header=T,which = 2)
tables
dim(tables)
View(tables)

Links booklink

Contact Us: admin [ a t ] ucptt.com