[问题] 请教删除中文字之间的空白

楼主: atrisk (atrisk)   2018-08-06 05:37:30
大家好:
搜寻 ([一-龥,。:“”、‘’;\[\]])(\s+)([一-龥,。:“”、‘’;\[\]])
替代 \1\3
上面的方法是我在网络上找到用来删除中文字和中文字之间(包含些标点符号)
的多余空白,因为使用OCR软件辨识中文时一定会出现这现象。
一直没办法让OCR软件事先避免产生空格(OCR软件好笨?!),所以只能事后做补救。
有些好奇项目1(和项目3)为何加\[\],不知有无特别的意义?是作者考虑不够周详吗?
因为既然已经将[和]放入搜寻条件内了,为何不将类似的<和>等等也放进来?
谢谢!
作者: LPH66 (-6.2598534e+18f)   2018-08-06 21:54:00
正规表示式的 [ ] 是字符集, 表示 [ ] 之间的任一字符例 [ABC] 表示 A 或 B 或 C, 但不含 [ ] 两个字不过我不太清楚为何目标是全型字符的这条正规式会想加入半型的 [ ] 就是了

Links booklink

Contact Us: admin [ a t ] ucptt.com