Re: [问题] VBA 抓非固定表单的资料

楼主: Neisseria (Neisseria)   2016-06-26 12:47:52
如果妳的专业不是资讯相关的,去 soft job 征人做比较快
只是帮忙抓资料,应该不算写论文的枪手
如果想自己来的话,提示一下:
因为那个网页是用 frame 分成数个网页
可以单独处理其中一个子页面,会比较简单,如下:
http://structurednotes-announce.tdcc.com.tw/Snoteanc/apps/bas/BAS210.jsp
然后,观察一下网页原始码
可以发现那个按钮会引发一段 JavaScript 程式
单纯用 HTTP GET/POST 可能无法作用
而要使用 Selenium 这种网页自动化软件,模拟操作选单和按钮的动作
Selenium 有许多种语言的 binding,挑一个喜欢的即可
如果没有特别的偏好,建议选 Python 的 binding
然后,就要开始自己刻命令稿来自动化得到网页
写好命令稿后,可取得网页原始码
之后,再用 HTML parser 去取出自己需要的部分
附上一小段范例,仅供参考
https://pastebin.com/PJEyDPCt
小弟只是一时手痒,试玩一下,不是什么高手
希望板上各位大大不要鞭太大力 3Q
※ 引述《Super16666 (SuperJJ)》之铭言:
: 软件:EXCLE
: 版本:2010
: 想问怎样抓下面的资料,我是在TDCC境外平台
: http://structurednotes-announce.tdcc.com.tw/Snoteanc/
: 因为论文需要,想要一口气抓下方所有的资料(如下图),可是这个真的太多了...
: http://i.imgur.com/YAdT3ng.png
: 进去网站之后,点左侧"商品总览"
: 我想要一口气把所有"发行人/总代理人"下方的表格都下载下来
: http://i.imgur.com/c1M7BaTg.png
: 可是有两个困难点
: 1. 第一个就是从EXCEL的时候,如果我直接COPY网址,他只会连到这个首页...
: 这样子就不能直接抓表格...
: 2. 就是他的页码接口很不友善,只能一页一页点,也要点到最后一页才知道总共有几页
: 而且假设你要到第十页只能一页一页点...
: http://i.imgur.com/TmhefhZ.png
: 想问问看有没有大神可以一口气下载全部资料...
: 救救小妹我的论文QQ
: 目前有网友是建议用createobject("internetexplorer.application")
: 不过我已经尝试好久了真的弄不太出来,有人可以稍微指点一下吗?

Links booklink

Contact Us: admin [ a t ] ucptt.com