[讨论] 自炊PDF重排版不需OCR

楼主: arkr (海龟仔)   2020-01-07 20:04:17
各位版友好,书版第一次发文请大家多多指教。
手机发文,若是排版跑掉还请大家海涵。
更新版友意见
1. viaggiatore:富士通 Scan Snap ix500软件随附文字辨识软件,可扫描时生成可供搜寻
的档案
2. decorum:使用koreader重排版可直接在阅读器操作,但中文书无法选取文字否则会重启
,至今开发团队无解
最近开始尝试自炊,但因为手边没有适合的OCR软件,同时听说中文OCR辨识率非百分之百,
且我无意花心力校正,因此尝试以K2pdfopt重排版的方式处理扫描后的档案。
以下是我尝试归纳后的流程,提供给有兴趣自炊的版友参考。
书籍类型:直排书,单栏,纯文字
软件需求
1. PDF编辑软件:可裁切、旋转(eg. Adobe Acrobat)
2. K2pdfopt:重排版
步骤
1. 扫描生成PDF档
2. 以编辑软件裁切白边,仅保留文本。页码与天地的章节名称会影响重排版效果,建议切

3. 以K2pdfopt进行重排版,以下为设定步骤,未注明表示保持默认(default),以Kindle 8
为例
3.1 Add file
3.2 Device选Kindle 1-5。若没有合适机型须于Additional options字段键入-fc-后调
整参数
3.3 Additional options字段键入 -rt 90 -ls
3.4 Max columns调整为1
3.5 下方勾选Smart line breaks (调整为0.001)、Re-flow text、Fast Preview
3.6 右下方Preview重排版后的页面,可以多看几页确认。此时页面为上下颠倒,是正
常的
3.7 Convert All Files输出档案
4. PDF编辑软件旋转180度,完成
用本方法可以规避OCR后的校正问题,并维持直排书排版,并可适用于6吋或各种尺寸的阅读
器。但若是书籍排版方式复杂(例如图文夹杂),可能要多加尝试调整参数,或干脆使用大尺
寸阅读器。
祝大家自炊顺利。
参考资料
直排书重排版参数设定 https://www.mobileread.com/forums/showthread.php?t=144711&p
age=91
作者: nnlife (恩尼)   2020-01-07 22:36:00
推个
作者: p597fg (Jay)   2020-01-08 08:03:00
想请问这个软件可以用来重排直书的自炊档吗?抱歉 刚刚没注意看到
作者: pshuang (中山先生忠实信徒-我爱萝)   2020-01-08 10:04:00
请问是用哪一种设备扫描?
作者: viaggiatore (▁音)   2020-01-08 13:29:00
推个。不过我想另外知道有没有校正图片倾斜更快的辅助软件或方法? 用PHOTOSHOP一张张校正倾斜图片太慢至于转为可搜寻文字在我使用的富士通Scan Snap ix500随机附赠的软件就很好用了,比较没有文字辨识的问题
作者: p597fg (Jay)   2020-01-08 14:08:00
Scan Tailor纠偏好用,但是只吃图片档
作者: decorum (Festina Lente)   2020-01-08 14:42:00
横排的在Koreader上reflow的效果还不错 不过中文书籍在重排过后 不能划选文字 会造成软件重启 开发团队至今解决不了 这颇为严重 因为不能摘要、划重点、查字典幸好问题只在中文书上发生
作者: rerun (礼让)   2020-01-08 15:52:00
看书这么累
作者: viaggiatore (▁音)   2020-01-09 02:50:00
在 Scan Snap 档案选项中就有选取OCR口转换成可搜寻的PDF档案 (这项打勾)我的书都拆好的,但是很多本身就印歪了,或者是纸张吸入扫描时很容易顷斜一点点,档案也跟着倾斜我用的不是平台式的扫(CZUR那种),而是很像打印机一直吸入纸张扫描很快的那种。实际使用那种机器就会想书看得再多也比不上扫描器,但怎么用出来是人的能耐在那种机器问世后夸耀书看得多少显得没有意义..谢谢arkr p597fg提供的资讯,可以处理图档就很够用,因为我可以把多个JPG图档用软件工具转成一个PDF

Links booklink

Contact Us: admin [ a t ] ucptt.com