我只想在对google search 爬取文章
例如 [email protected] 有多少业者
https://imgur.com/a/kLSId6D
会对结果收集并存放到excel
一笔资料会有五个字段
1.网域
2.完整网域
3.主标题
4.内文
5.图片网址
对我发现一个问题
每个物件用BS4的class都是随机乱码,
造成不保证后续都可以用同个class去抓
我自己用了几次 目前都是同个物件class(乱码)没变
但我觉得可能过几天就会更换
Q1.请问google search 结果的html class似乎都是乱码取名该怎应对?
Q2.class=VwiC3b yXK7lf lVm3ye r025kc hJNv6b Hdw6tb
这怎class该怎抓阿 名称太长且中间有空格,一直抓失败..