PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] 国图标准中心爬虫
楼主:
inch446
(inch446)
2017-12-10 21:41:43
小弟第一次接触Python爬虫,
目前需要写一个程式爬国家图书馆标准图书中心的资料,
http://isrc.ncl.edu.tw/search_result_isrc.aspx
即是用一首音乐的ISRC(类似音乐的身分证字号),
去抓该首音乐的资料,如中文歌名、歌、曲、词等,
直接在该网站搜寻的结果如下图,
https://i.imgur.com/gQnrkbS.png
但小弟在网络上都找不到类似的专案,
请问各位大大该如何下手是好?谢谢!
作者:
vi000246
(Vi)
2017-12-10 23:23:00
这个很简单啊 去google requests的get用法吧
作者:
ckvir
(ckvir)
2017-12-11 00:19:00
先理解一下http 运作吧
作者:
zo6596001
(超帅肥宅)
2017-12-12 03:15:00
正好是用GET方法,把url最后的"search_string="改成你要的字串就好。 这样应该可以收到HTML。剩下只要解析HTML的资料就好。
继续阅读
Re: Qthread 问题
brt
[问题] sympy fsolve and mpmath findroot
joeywayi
[问题] 关于django数据库的问题
naestnecniv
[问题] python 如何自动执行 rhino script
caron0225
Re: [问题] django static标签使用变量
djshen
Re: [问题] 如何读取大量json档
uranusjr
[问题] 上网抓取雅虎财经的资料
iuz
[问题] 求救python2.7(32bit)吃的内存上不去
q3411437
[闲聊] selenium 设定下载路径
pig98520
[问题] 如何读取大量json档
a11780922
Links
booklink
Contact Us: admin [ a t ] ucptt.com