Re: [问题] 网络爬虫相关问题

楼主: tses89214 (幻想天空)   2017-06-07 13:44:38
※ 引述《tses89214 (幻想天空)》之铭言:
: [问题类型]:
:
: 程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
: [软件熟悉度]:
: 入门(写过其他程式,只是对语法不熟悉)
: [问题叙述]:
: 各位好,我想要抓取旅游网站上面的金额的资讯,就是橘色的NT$的部分
: https://goo.gl/rTUzDp (网址过长所以缩了一下)
: 但因为没有处理过动态的网站而卡关,
: 目前进度是使用read_html以及readLines这两个function试过,
: 发现抓到东西的与看到的网页原始码不一样。
: 从开发者工具虽然有看到几个.js的项目,
: 却不太知道该用GET或是POST什么东西给他们,
: 所以想问:该用什么方法才能得到想要的资料呢?
: 谢谢!
: PS.只要能拿到网页的原始码就行了,后面的文字处理我可以自己来。
: [关键字]:
:
: 网络爬虫
:
抱歉又有新的问题了QQ,
目前进度是想要爬在各种行程里面,不同票种(成人,小孩,老人等)的票价,
从开发者工具看到它是在选定套餐与时间之后,对一串网址传送讯息得到资料,
以同一个行程当例子(https://goo.gl/rTUzDp),范例网址如下:
https://www.klook.com/xos_api/rest/arrangements_api/3547822.json?gateway=web&_=1496809592949
但我搞不懂的是,他的"...api/3547822.json"这段,
那串数字是怎么得到的? 不同的套餐、时间,那串数字就会不一样,
想说如果能知道规律就能得到回传的资讯了,
抑或者有其他的方法可以得到不同行程中的不同票种的票价吗?

Links booklink

Contact Us: admin [ a t ] ucptt.com