小弟最近在练习Python抓资料与字串处理的问题
发现抓下来的文字不知道该如何赋予三引号强制变为字串
用len(a)得到的字串长度为1
原本应该是会得到<div class="unified-baseball-card" ..... </div>
这一段网页原始码, 想说可以用引号分割得到第六部分的网址
不知道各位大大是否有更好的方法可以解决小弟的问题呢?
谢谢!!
原始档如下:
# -*- coding: UTF-8 -*-
import requests
from bs4 import BeautifulSoup
res =
requests.get("https://social.msdn.microsoft.com/Forums/zh-TW/389e90b5-b2d9-412b-a7eb-91cb9a68d108/vs2015-?forum=230")
soup = BeautifulSoup(res.text.encode('utf-8'))
a = soup.select('.unified-baseball-card')[0]
print a
b = a.split('"',6)
print b[5]
若用文字带入会得到
https://social.msdn.microsoft.com/Forums/zh-TW/user/threads?user=a670334
也就是我想要得到的解答QQ