PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
R_Language
[问题] 网络爬虫相关问题
楼主:
tses89214
(幻想天空)
2017-06-06 23:39:11
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
各位好,我想要抓取旅游网站上面的金额的资讯,就是橘色的NT$的部分
https://goo.gl/rTUzDp (网址过长所以缩了一下)
但因为没有处理过动态的网站而卡关,
目前进度是使用read_html以及readLines这两个function试过,
发现抓到东西的与看到的网页原始码不一样。
从开发者工具虽然有看到几个.js的项目,
却不太知道该用GET或是POST什么东西给他们,
所以想问:该用什么方法才能得到想要的资料呢?
谢谢!
PS.只要能拿到网页的原始码就行了,后面的文字处理我可以自己来。
[关键字]:
网络爬虫
作者:
celestialgod
(天)
2017-06-06 23:46:00
http://imgur.com/a/bIPAf
http://imgur.com/a/jcqh6
楼主:
tses89214
(幻想天空)
2017-06-07 00:02:00
感谢!! 我试试看!!C大您好,我尝试后发现得到的东西还是不一样,是不是在程式上面我有写错呢?这是使用GET的
http://imgur.com/s2n0hfi
使用POST似乎导向了不对的网址
http://imgur.com/J2Tmzqb
也有试过在原网址后面加上?fp_count=1,结果也是同样在GET的部分将fp_count改成=2就可以了(不清楚为什么
继续阅读
Re: [问题] 依特定条件补足日期
celestialgod
Re: [问题] 依特定条件补足日期
carl090105
[问题] 依特定条件补足日期
menghsuanliu
[问题] R 语言读取序列资料
ariainaqua
Re: [问题] 相关爬虫问题
jack155861
[问题] R-studio的help背景色可以调整吗?
LIAR
Re: [问题] Json to R and Data talbe/matrix arrange
celestialgod
[问题] 时间撷取问题
hotlin0709
[问题] 循环用法请教
tony1331
[问题] 相关爬虫问题
jack155861
Links
booklink
Contact Us: admin [ a t ] ucptt.com