[问题] Scrapy无法抓取资料 TZULIU PTT批踢踢实业坊

[问题] Scrapy无法抓取资料

楼主: TZULIU (消费券收购商) 2017-07-10 13:48:04

小弟最近在练习使用Scrapy，在网络上找了一个练习范本如下：
https://www.youtube.com/watch?v=w4PPlkJFzCo
前半段运作没有任何问题，
但当开始使用 yield scrapy.Request 的时候却发现spider没有爬取到资料，
想请问各位高手原因为何？
程式码如下：
import scrapy
from bs4 import BeautifulSoup
class Apple1Spider(scrapy.Spider):
name = 'apple'
allowed_domains = ['appledaily.com']
start_urls = ['http://www.appledaily.com.tw/realtimenews/section/new/']
def parse(self, response):
domain = "http://www.appledaily.com.tw"
res = BeautifulSoup(response.body)
for news in res.select('.rtddt'):
yield scrapy.Request(domain + news.select('a')[0]['href'],
callback=self.parse_detail)
def parse_detail(self, response):
res = BeautifulSoup(response.body)
print(res.select('#h1')[0].text)
我所使用的版本为Python3.6.1，
谢谢。

作者: coeric ( ) 2017-07-10 18:01:00

scrapy不给装用requests捞没啥问题

继续阅读

[问题] 为何python shell 会占用那么多CPUssd860505da [问题] ctypes 如何处理回传可能为NULL的函式?wtchen [心得] PTT 爬虫函式库CodingMan [问题] PyInstaller的EXE删不掉HenryLiKing Re: [问题] 呼叫C 函式的问题vgy [问题] Pandas Dataframe 相减问题m87dd05 Re: [问题] 请问一个在matplotlib 显示中文的问题s960405s [问题] word2Vec 自然语言处理中文语料库zero0o0o8279 [问题] 命令列数学排版的问题LessonWang [问题] python 编码gn301046