[问题] pd.read_csv ParserError

楼主: ctr1 (【积π】)   2019-10-23 22:03:19
df = pd.read_csv('test3.log', sep="\s+", header=None, prefix='COL')
文本分隔是以' '或大于一个空白切分
没有header
但是当切到内容含有 // 时会报错
ParserError: Error tokenizing data. C error: Expected 6 fields in line 2, saw
7
有查过使用error_bad_lines=False属性 但想保留资料
想问问看是否有不需要replace整份文本而可以正常read_csv档
因为csv档又大又多,若是一行一行replace很耗时费力
感谢大大
作者: TitanEric (泰坦)   2019-10-23 22:36:00
这应该是因为你有多//所以导致attributes不一致 看你要先做前处理移掉还是你指定要7个attributes 空值填NaN
楼主: ctr1 (【积π】)   2019-10-23 22:38:00
没办法read_csv->dataframe,是否只能一行一行的前处理呢
作者: TitanEric (泰坦)   2019-10-24 10:35:00
可以一行处理 就用python读档处理后再存新档https://bit.ly/2pcmswm 刚做的 可以参考一下
楼主: ctr1 (【积π】)   2019-10-24 14:50:00
谢谢你~

Links booklink

Contact Us: admin [ a t ] ucptt.com