[问题] 字串中符号处理问题

楼主: NikonD800E (D800E)   2016-08-01 18:03:35
小弟最近在练习Python抓资料与字串处理的问题
发现抓下来的文字不知道该如何赋予三引号强制变为字串
用len(a)得到的字串长度为1
原本应该是会得到<div class="unified-baseball-card" ..... </div>
这一段网页原始码, 想说可以用引号分割得到第六部分的网址
不知道各位大大是否有更好的方法可以解决小弟的问题呢?
谢谢!!
原始档如下:
# -*- coding: UTF-8 -*-
import requests
from bs4 import BeautifulSoup
res =
requests.get("https://social.msdn.microsoft.com/Forums/zh-TW/389e90b5-b2d9-412b-a7eb-91cb9a68d108/vs2015-?forum=230")
soup = BeautifulSoup(res.text.encode('utf-8'))
a = soup.select('.unified-baseball-card')[0]
print a
b = a.split('"',6)
print b[5]
若用文字带入会得到
https://social.msdn.microsoft.com/Forums/zh-TW/user/threads?user=a670334
也就是我想要得到的解答QQ
作者: kenduest (小州)   2016-08-01 19:04:00
a 不是 text, 那是一个 class若你真的要取这个 class 直接用内部显示名称的话救自己加上 a = str(...) 方式转一层就好
作者: hoho8 (hoho)   2016-08-02 04:31:00
楼主: NikonD800E (D800E)   2016-08-02 09:29:00
感谢两位大师~ 是我学艺不精误认他为字串也感谢hoho8帮忙抓出soup里头的连结!!

Links booklink

Contact Us: admin [ a t ] ucptt.com