[问题] 存盘和LOOP ibgvdlbj PTT批踢踢实业坊

[问题] 存盘和LOOP

楼主: ibgvdlbj (:)) 2019-08-18 14:54:50

Hi 各位大大我又上来请教大家了
目前想用python识别pdf档做 key word 查寻
也就是 optical character recognition
昨天朋友说 pytesseract 只能识别图片不能识别 pdf档
所以我先手动把其中一个pdf档存成图档当测试
写了一段code 成功的输出在 cmd里
目前在思考能不能储存成text档(格式会跑掉吗?)
然后让程式读取资料夹内的下一个 pdf 档案自行转成图档后再跑~~
如果以上有可能的话
该怎么写呢? 麻烦各位大大谢谢^^"
以下放code:
from PIL import Image
import pytesseract
import argparse
import cv2
import os
# construct the argument parse and parse the arguments
ap = argparse.ArgumentParser()
ap.add_argument("-i", "

作者: eamansf96xs (草爷) 2019-08-18 19:28:00

这版有点少人。。。帮你推个

作者: mirror0227 (镜子) 2019-08-18 20:33:00

我猜你在寻找 pickle

作者: s860134 (s860134) 2019-08-18 23:32:00

for loop 和 os. path 就可以做完了

楼主: ibgvdlbj (:)) 2019-08-19 06:51:00

请问S大，应该要放在哪里呢？谢谢！

继续阅读

[问题] 请教切字串love113w Dataframe问题求解gene50814 [问题] 如何画出自定义图像clansoda [问题］tkinter label/button 无法显示Jackylover [问题] GCP 上 django 如何用 memcachef496328mm [问题] 身分证条码wii8898333 [问题] contiune可以不要整个循环重来吗?fm4n3fm4n3 [闲聊] Python有没有社群可以交流?applebg [问题] selenium按键元素被拦截yuuyoru Re: [问题] 递回写法cutekid