https://reurl.cc/yZgRXD
上面是用Python抓八卦版资讯,我不懂得是:
1.第29行有个articles = [] ,第71行也有个 articles = [],为什么?如果都是要储存
文章,那第71行的 articles = []需要写吗?
2.def get_author_ids(posts, pattern):
ids = set()
for post in posts:
if pattern in post['author']:
ids.add(post['author'])
return ids
这边完全看不懂,而且跟前面那个抓作者的资料有关系吗?他之前不就写:
author = '' # author = d.find('div', 'author').text if d.find('div',
'author') else ''
那不就用#后面那行就好了?为什么还要def get_author_ids这个函数?
请大大指教,感谢~~