[问题] 爬虫:换页与主题的双重循环

楼主: paranoia5201 (迈向研究生)   2019-03-05 17:36:21
我正在学习网络爬虫,有个小问题想请教。
以下是我的想要爬的网址,有略作修改:
'https://MainAddress?Page=1&city=tpe'
简单而言,Page有超过200页,而city有近30个。
想到一个简单的做法是,把网址书写如下:
link = 'https://MainAddress?Page={}&city={}'.format(n,m)
换页的部分想到用下面的方式写:
n = 1
while n < total_pages:
print(link, n)
n = n + 1
但是如果还要加入city的m......我就暂时卡住,不知道该要怎么包了。
有什么建议的方式可以把它全部包起来吗?
p.s. 有个list把所有的city都先罗列出来,或许可以用它包第二层循环?
感谢指导~
作者: adrianshum (Alien)   2019-03-06 06:52:00
for (n,m) in {page,city for page in range(total_page) for city in city_list}: 之类? 随便写 syntax应该有误。没记错的话 generator expression 或 listcomprehension 可以用两个 for然后给出所有组合不然就直接写对应的两层for loop 就好
作者: HenryLiKing (HenryLiKing)   2019-03-05 17:41:00
网址连不到欸
作者: nini200 (200妮妮)   2019-03-05 17:43:00
通常page和city有着顺序关系 但你这里我看不到直接给网址最快 不用猜你可能错误的想法
作者: HenryLiKing (HenryLiKing)   2019-03-07 00:49:00
大家太认真了 感觉他不会回来解释和放网址了

Links booklink

Contact Us: admin [ a t ] ucptt.com