Re: [问题] facebook粉丝团耙文 kevinsky PTT批踢踢实业坊

Re: [问题] facebook粉丝团耙文

楼主: kevinsky (kevinsky) 2014-07-29 15:45:53

※ 引述《kevinsky (kevinsky)》之铭言：
: 程式咨询：
: 网络上有一些facebook的R语言截取资讯教学
: 但是最近想从粉丝团来蒐集资讯
: 却没办法把网页抓进我的程式里面
: 程式码如下：
: library(RCurl)
: library(XML)
: library(Rook)
: library(Rfacebook)
: options(RCurlOptions = list(verbose = FALSE, capath = system.file("CurlSSL",
: "cacert.pem", package = "RCurl"), ssl.verifypeer = FALSE))
: html = getURL("https://www.facebook.com/Yankees.Taiwan")
: print(html)
: 我print出来的结果always是空的
: 但是若换成其他https网站是可以抓到网页程式码的
: 不知道大家有没有什么建议呢?
: 谢谢
我把其中一行修改成
html = getURL("https://www.facebook.com/Yankees.Taiwan", followlocation =
TRUE, cainfo = system.file("CurlSSL", "cacert.pem", package = "RCurl"))
就能print出来一些html内容
但是该网页的po文仍不在所抓取的html内容里面
不知道大家有没有什么建议呢?
谢谢

作者: kenshin528 (成立奥凶帝国!!) 2014-07-29 17:29:00

直接呼叫fb 的API 如何？

作者: gsuper (Logit(odds)) 2014-08-01 09:09:00

看起来是个很难的问题我之前parse股票资讯的时后有做过类似的事KeyPoint is to "Print" html but not download SourceCode

作者: Wush978 (拒看低质媒体) 2014-08-02 11:07:00

最近我们社群有在介绍phantomjs我觉得这种问题可能用其他工具更简单

继续阅读

[问题] facebook粉丝团耙文kevinsky [问题] 资料整理ddtddt Re: [问题] data.table 改值HeroNoah [问题] data.table 改值celestialgod [问题] 关于自定义函数Ceferino Re: [心得] sqldf效率问题celestialgod [心得] sqldf效率问题kenshin528 [分享] R 语言的工程面Wush978 [问题] 关于 R 接口问题rockken Re: [问题] 如何以RS232读入即时资讯Watermelonnn