Re: [问题] 爬虫:换页与主题的双重循环

楼主: rexyeah (ccccccc)   2019-03-05 22:11:54
试试看也许可以解...
==================
cities = [...]
def accessURL(page, city):
if pageNotFound:
# set exit condition
return
else:
print(f"https://MainAddress?Page={page}&city={city}")
return accessURL(page+1, city)
for city in cities:
accessURL(1, city)
※ 引述《paranoia5201 (社会黑暗、行路难)》之铭言:
: 我正在学习网络爬虫,有个小问题想请教。
: 以下是我的想要爬的网址,有略作修改:
: 'https://MainAddress?Page=1&city=tpe'
: 简单而言,Page有超过200页,而city有近30个。
: 想到一个简单的做法是,把网址书写如下:
: link = 'https://MainAddress?Page={}&city={}'.format(n,m)
: 换页的部分想到用下面的方式写:
: n = 1
: while n < total_pages:
: print(link, n)
: n = n + 1
: 但是如果还要加入city的m......我就暂时卡住,不知道该要怎么包了。
: 有什么建议的方式可以把它全部包起来吗?
: p.s. 有个list把所有的city都先罗列出来,或许可以用它包第二层循环?
: 感谢指导~

Links booklink

Contact Us: admin [ a t ] ucptt.com