各位好,小弟看了python的爬虫基础
要把网页的这段爬下来<title>Scraping tutorial 1 | 莫烦Python</title>
看了教学是用以下这段
res=re.findall(r"<title>(.+?)</title>",html)
print(res[0])
想问的是用r"" 这个用法里面为什么不是用r"<title>[.+?]</title>"
而是用(.+?) ,搞不太懂()的意义,也搞不太懂有没有加?的差别
恳请各位大大解释
因为findall会将所有符合的情况以list回传,例如html="<title>A</title><title>B</title><title>C</title>", 那re.findall就会回传["A", "B", "C"]