本来一直都是用python在做网络爬虫
但因为公司有新需求
想要直接在网页上按按钮 就能抓下需要的资料
因此我想到了google 插件 可以满足这种UX
而google插件只能用JS写 所以我就重拾JS的怀抱
玩了一整天后
目前觉得JS应该可以做网络爬虫
只是不知道是否好做呢?
像Python有好用的BS4 selenium等等 做网络爬虫很方便很轻松
目前我只知道jquery的 querySelectorAll function
想知道还有没有其他更好用的网络爬虫function呢?
感谢各位大神的解答!
node-webkit也ok啊...也没跨域的问题ajax乱冲iframe也可以乱穿~自加code :D
作者: rarex (╰(〒皿〒)╯) 2016-02-17 21:25:00
node.js有很多这种资源呀 可以往这方面去找找看
nodejs + spider/crawler一大堆
原PO想问的是前端JS吧?不然后端爬虫用什么语言哪有差网页端JS的话,跨网域的抓取有满多限制的
前端爬跨网域太麻烦, 后端爬可用phantom.js