Re: [问题] 用R抓取八卦版

楼主: bluecadence (Maxwell's demon)   2017-05-10 19:50:31
因为你没处理 over18 的 cookie
library(RCurl)
curl <- getCurlHandle()
curlSetOpt(cookie="over18=1", followlocation = TRUE, curl=curl)
url <- 'https://www.ptt.cc/bbs/Gossiping/index20865.html'
html <- getURL(url, curl=curl)
这样应该就没问题了
※ 引述《iwfmf (i @#$%@#$^$%^ f)》之铭言:
: : 再用R爬虫抓取八卦版,但在getURL 时,抓取的资料为空
: [程式范例]:
:
: > url
: [1] "https://www.ptt.cc/bbs/Gossiping/index20865.html"
: > html = getURL(url,ssl.verifypeer = FALSE,encoding="UTF-8")
: > html
: [1] ""
作者: iwfmf (i @#$%@#$^$%^ f)   2017-05-11 10:52:00
解决了 感谢您!! 看来是我原本处理over18的写错

Links booklink

Contact Us: admin [ a t ] ucptt.com