在程式里用pdftotext的方式将PDF档转成UTF-8的txt文字档
接着抓出txt里面的一段文字
$_str = '生日:066年11月28日';
$_str = str_replace("生日:", '', $_str);
$_str = str_replace("年" , '', $_str);
$_str = str_replace("月" , '', $_str);
$_str = str_replace("日" , '', $_str);
echo $_str;
Output:066年1128
我手动复制没被替换过去的“年”做替换,发现可行,
google到是字符代码不相同的问题,这个状况第一次遇到,
想问一下版上大家有哪些经验,想伸个关键字,谢谢。