[问题]Selenium没办法爬 MOMO购物网 a6409tw PTT批踢踢实业坊

[问题]Selenium没办法爬 MOMO购物网

楼主: a6409tw (爆蝾螈) 2018-12-08 21:51:50

各位大大好
如题小弟发现MOMO购物网有使用JS渲染
所以我使用Selenium Chromedriver的Headless方式去抓取
商品品名、价格、商品网址
可是不管用什么方式
都没办法爬下来Q
以下是我的Code
from selenium import webdriver
from bs4 import BeautifulSoup
options = webdriver.ChromeOptions()
options.add_argument('headless')
driver = webdriver.Chrome(executable_path =
r'/Users/syu/Downloads/chromedriver',chrome_options=options)
driver.get('https://www.momoshop.com.tw/search/searchShop.jsp?keyword=adidas')
ps = driver.page_source
ps = driver.page_source
soup = BeautifulSoup(ps,'lxml')
接下来尝试用
items = driver.find_elements_by_css_selector('.prdName')
items = driver.find_elements_by_class_name('prdName')
items = soup.findAll('p',{'class':'prdName'})
怎么抓都抓不到任何东西
已经试了一整天
也爬了很多文
但都还是找不到原因Q
真的麻烦各位大大了QQ

作者: TakiDog (多奇狗) 2018-12-09 11:51:00

你有看过他网页加载的顺序吗一定要selenium的话写一下time.sleep吧先把抓到的html导出，看好标签再找requests 直接对这处理吧host../ajax/ajaxTool.jsp

作者: v86861062 (数字人:3) 2018-12-09 12:47:00

为什么前面两行是proName? 应该是用prdName吧 :)

作者: TakiDog (多奇狗) 2018-12-09 18:16:00

F12看一下 post过去就可以拿到资料了

继续阅读

[问题] 解方程式kottey [问题] 重复执行py档并纪录结果newdas Re: [心得] PTT Libraryjay20210 [问题] 有关于鼠标点击座标并写入档案a00011111143 [问题] 请教有无比较好的写法st40182 [问题] 如何让立体声音乐分离左右声道winnie0117 [问题] anaconda 下的pipsilencemars [问题] 推荐用VPS跑程式吗？nthulibrary [问题] linux 自动排程进入虚拟环境yanwu0105 [问题] 有关df.loc[]的问题sssh