请教大家有关爬虫问题
我有爬虫各航空公司的货物运单状态
甲去大陆购物 可从业者提供的报关单、主提单、副提单 查到包裹状态
例如:飞机起飞与否等资讯、清关状态
这是华航的CARGO 货况查询 网站
https://reurl.cc/5qKZzq
因为有JS所以利用selenium+BeautifulSoup 可以轻松爬到任何html资料
我不是用path下去定位而是抓取id找想要的到资料
但有些id长这样:
ContentPlaceHolder1_rpFlightEvent_lblWgt_0
ContentPlaceHolder1_rpFlightEvent_lblPcs_0
ContentPlaceHolder1_rpFlightEvent_lblArrTime_0
ContentPlaceHolder1_rpFlightEvent_lblOff_0
Q1.id尾数都是无意义的乱码字母与数字组成
我这次可以轻松爬到资料,下次该怎防范尾数产生新的乱码id了?
Q2.如Q1. 网站这样做 算是反爬虫手段之一吗?
谢谢