Re: [问题] 零基础的网页Parse?

楼主: psinqoo (零度空間)   2016-06-11 00:05:55
之前看到想回,放假回一下,你参考 我是用这样子做法
我是用 Ubuntu 所以没 big5问题 (很讨厌微软,每次都是卡在转码,囧。)
我猜原网页是 用 utf8 所以在转码 出问题
library(XML)
library(httr)
library(rvest)
library(xml2)
x1 <-GET("http://gweb.wra.gov.tw/ebooks/ebook/hyb2000/1140H058.htm")
x2<-html(x1)
tables<-html_nodes(x2,"table")
y1<-html_table(tables)
y1
#请自行挑想用的表格 y1<-html_table(tables[2])
sessionInfo()
R version 3.2.3 (2015-12-10)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 14.04.3 LTS
收工
作者: celestialgod (天)   2016-06-11 00:53:00
rvest 还没研究过Orz

Links booklink

Contact Us: admin [ a t ] ucptt.com