[问题] 爬虫 期货表格

楼主: WhiteComet (???N)   2018-11-20 10:45:30
code
https://pastebin.com/7nj8i6RD
如下:
import requests
import sys
import re
from bs4 import BeautifulSoup
import pandas
import lxml
Juridical_person = "http://www.taifex.com.tw/cht/3/futContractsDateExcel"
df = pandas.read_html(Juridical_person)
print(df[1])
pandas读进来之后,print出来发现表格歪掉了
可能是前两栏有些储存格合并的关系
我该怎么呈现和网页一样的效果呢?
我应该在读进来之前就先对html作处理
还是读进来之后再对df作表格的排版
作者: jiyu520 (不要鲫鱼我)   2018-11-20 16:13:00
或许用BeautifulSoup抓回table后, 再做清理解析比较好

Links booklink

Contact Us: admin [ a t ] ucptt.com