Re: [问题] facebook粉丝团耙文

楼主: kevinsky (kevinsky)   2014-07-29 15:45:53
※ 引述《kevinsky (kevinsky)》之铭言:
: 程式咨询:
: 网络上有一些facebook的R语言截取资讯教学
: 但是最近想从粉丝团来蒐集资讯
: 却没办法把网页抓进我的程式里面
: 程式码如下:
: library(RCurl)
: library(XML)
: library(Rook)
: library(Rfacebook)
: options(RCurlOptions = list(verbose = FALSE, capath = system.file("CurlSSL",
: "cacert.pem", package = "RCurl"), ssl.verifypeer = FALSE))
: html = getURL("https://www.facebook.com/Yankees.Taiwan")
: print(html)
: 我print出来的结果always是空的
: 但是若换成其他https网站是可以抓到网页程式码的
: 不知道大家有没有什么建议呢?
: 谢谢
我把其中一行修改成
html = getURL("https://www.facebook.com/Yankees.Taiwan", followlocation =
TRUE, cainfo = system.file("CurlSSL", "cacert.pem", package = "RCurl"))
就能print出来一些html内容
但是该网页的po文仍不在所抓取的html内容里面
不知道大家有没有什么建议呢?
谢谢
作者: kenshin528 (成立奥凶帝国!!)   2014-07-29 17:29:00
直接呼叫fb 的API 如何 ?
作者: gsuper (Logit(odds))   2014-08-01 09:09:00
看起来是个很难的问题我之前parse股票资讯的时后有做过类似的事KeyPoint is to "Print" html but not download SourceCode
作者: Wush978 (拒看低质媒体)   2014-08-02 11:07:00
最近我们社群有在介绍phantomjs我觉得这种问题可能用其他工具更简单

Links booklink

Contact Us: admin [ a t ] ucptt.com