最近在自学网络爬虫,一开始用BeautifulSoup
抓一些简单的静态网页没有问题,抓下来一大串html
我可以用re去解开来一个一个看
但对于需要更进阶操作的网站,就显得有些吃力
我知道可以进一步去学习Selenium或Scrapy
但在那之前,我想先学习一些网站的基本原理
市面上的书通常只会教傻瓜式的架站
我想了解的是,我打开浏览器,F12开后台
Network页面里面的各种机制
像是浏览器式怎么知道要怎么下request
网站response的格式是从哪边取得,怎么知道要怎么解
请问有推荐的详细教学网站或书籍吗?
感谢