[问题] 国图标准中心爬虫 inch446 PTT批踢踢实业坊

[问题] 国图标准中心爬虫

楼主: inch446 (inch446) 2017-12-10 21:41:43

小弟第一次接触Python爬虫，
目前需要写一个程式爬国家图书馆标准图书中心的资料，
http://isrc.ncl.edu.tw/search_result_isrc.aspx
即是用一首音乐的ISRC（类似音乐的身分证字号），
去抓该首音乐的资料，如中文歌名、歌、曲、词等，
直接在该网站搜寻的结果如下图，
https://i.imgur.com/gQnrkbS.png
但小弟在网络上都找不到类似的专案，
请问各位大大该如何下手是好？谢谢！

作者: vi000246 (Vi) 2017-12-10 23:23:00

这个很简单啊去google requests的get用法吧

作者: ckvir (ckvir) 2017-12-11 00:19:00

先理解一下http 运作吧

作者: zo6596001 (超帅肥宅) 2017-12-12 03:15:00

正好是用GET方法，把url最后的"search_string="改成你要的字串就好。这样应该可以收到HTML。剩下只要解析HTML的资料就好。

继续阅读

Re: Qthread 问题brt [问题] sympy fsolve and mpmath findrootjoeywayi [问题] 关于django数据库的问题naestnecniv [问题] python 如何自动执行 rhino scriptcaron0225 Re: [问题] django static标签使用变量djshen Re: [问题] 如何读取大量json档uranusjr [问题] 上网抓取雅虎财经的资料iuz [问题] 求救python2.7(32bit)吃的内存上不去q3411437 [闲聊] selenium 设定下载路径pig98520 [问题] 如何读取大量json档a11780922