[软件] PDF文字辨识(OCR) 有推荐的软件吗?

楼主: Linethan (我要什麼?)   2018-01-16 18:01:11
小弟时常会下载学术文献pdf档
在mac上或是iPad上阅读
许多比较古老的文献 似乎都是扫描档
看起来都是文字 但是无法选取文字 (被视为"图片"的样子)
所以在阅读pdf时 无法画重点
需求:
将PDF中的文字变成可以选取跟搜寻
已试过: Adobe Acrobat
可以达到我的需求, 但是....它好贵Orz
所以我想问问有没有其他推荐的软件?
要付费购买没关系 希望比较便宜点就好
已经google过, 找到许多pdf文字辨识的线上服务
但都是将pdf转换成word档或是txt档
我希望的是维持pdf档, 而且不要改变文章的字体格式外貌等等
只是纯粹将内文变成可以选取以及搜寻
请问有推荐的软件吗?
作者: yhli817 (Moneypenny)   2018-01-16 18:13:00
先把 PDF 档汇出成图片档,再用 OneNote 撷取看看?(之前用手机拍照再撷取有成功,这样也没更改到原始档的格式https://goo.gl/JAV8iZ
楼主: Linethan (我要什麼?)   2018-01-16 18:27:00
感谢yh大回复 我有试过OneNote 但它好像是把文字撷取出来在旁边 而不是直接把原始pdf档里的文字变得可选取不知道是不是我使用方式错误?我不是要把pdf档里的文字抓出来而已 通常抓出来也没用因为我看的文献都夹杂很多数学符号式子 通常那些被抓出来后都会乱七八糟无法阅读.....
作者: MilchFlasche (实践才能发光)   2018-01-16 18:35:00
数学式更难了吧……
作者: cmotpetb (镜花水月)   2018-01-16 18:52:00
画线改用方框 搜寻就没办法了 OCR麻烦没有什么无脑方便的作法
作者: reminiscence (记忆回溯)   2018-01-16 19:14:00
Ocrkit
作者: MuiMui (偶数)   2018-01-16 20:04:00
数学式还没看过可以完美ocr的@@
作者: vi000246 (Vi)   2018-01-16 21:01:00
太难...你有钱可能还找不到人帮你做现在的技术顶多就转成文字而已 要维持排版..还有数学符号 那应该无解了 可能连转成text都无法你可以试试找高手 http://cat.prhlt.upv.es/mer/但是我估起码5~10万起跳都有Adobe Acrobat了 有需求就买下去吧
作者: Qawww (QwQ)   2018-01-16 22:21:00
如果是英文的话 把图片上传google云端 然后用文件方式开启
楼主: Linethan (我要什麼?)   2018-01-16 23:21:00
Qa大大说的方法我也试过 但是google文件开启后就不再是pdf档了 那也是把文字撷取出来另外变成word档vi大 所以我要的并不是把pdf内容抓出来另存成文字档啊那样抓出来一定会乱 数学符号多半也抓不太出来我只是希望pdf内容的文字(夹杂数学)变得可以选取就好Adobe Acrobat的确可以做到我要的 不过实在很贵所以我才想问问有无其他能达到近似效果的软件remin大说的Ocrkit 好像可以做到Adobe Acorbat的效果!也比较便宜 感谢!
作者: blackkaku (black)   2018-01-17 01:14:00
放到evernote里面?

Links booklink

Contact Us: admin [ a t ] ucptt.com