[问题] PDF的格式比对

楼主: uioty (uioty)   2015-12-10 15:36:21
各位好,
关于PDF格式比对的问题是这样的:
假设系统要求PDF文件档案的格式如下:
边界设定N inch
字体需为 a, b, c 三种其中一种
字体大小介于10-12pt之间
页数用阿拉伯数字编排
等等
然后这个系统可以上传PDF,回传此份PDF是否符合格式
更进一步的可以说明格式哪里不符
我自己的想法有两个
一个是转成word,然后去抓word档案的metadata来比对
可是转成word似乎会有格式跑掉的风险
假设PDF中有表格或者图片
转换格式容易跑掉,这样处理边界问题可能就会有误
不过转成word的话
我觉得至少可以解决字体、字体大小以及页数是否用阿拉伯数字编排的问题
另个想法是用影像处理的想法去做
所以需要先有一个标准的sample档案
然后把pdf转成图档以后用图像的方式比对
我觉得这应该可以解决边界及字体大小的问题
不晓得有没有其他的方法或者想法呢?
谢谢

Links booklink

Contact Us: admin [ a t ] ucptt.com