因工作需求
需要用读取pdf上的表格
虽然试用过tabula,但其显现的效果不太好
所以想尝试换用pdfplumber
但在pip install pdfplumber的过程中遇到ERROR
看起来是UniDecodeError的问题
'cp950' codec can't decode byte 0xe2 in position 4981: illegal multibyte
sequence
不知道如何pip 的时候解决这个问题.....
另外我的PYTHON是3.8
虽然上网GOOGLE过相关办法
sys.setdefaultencoding("utf-8")
但上述办法似乎在好几个版本前就被拿掉
所以还想请问版上大大有成功安装过pdfplumber的经验分享
或我该如何解决这个问题
或是面临稍微有点复杂的pdf表格,该如何读取
说是复杂,其实他就是没有明确的表格 只用空格来区隔
所以导致我用tabula时候会某A栏的资料跑到隔壁栏去
先谢谢愿意看到这边了解我问题的版友们