[请问] 如何分办文字档哪些是ansi码哪些是utf8码

楼主: alphard (阿阿)   2015-06-22 22:47:15
目前需将某资料夹的所有文字档约4百多个合并成一个文字档
所以在cmd下指令type *.txt >> test
结果发现产生的档案会有部份乱码,
原因是资料夹里某些txt档是用ansi编码,而非UTF-8编码
由于在资料夹里都只显示txt,不知道哪个是ansi编码,哪个是UTF-8编码。
若用手动一一打开档案,再把ansi编码的档案改存UTF-8,实在太费工了。
另外有试着用ConvertZ批次转档,惟ConvertZ只接受全部为ansi档才可批次转。
所以有何方法或工具可办别资料夹里的txt档,哪些ansi编码,哪些为UTF-8编码?
使我能把这些ansi编码的文件挑出来,再喂给ConvertZ批次转档。
尝试了一个晚上+Googl爬文无解,只好问板上的强者了,
感谢!
作者: dearlove (初现)   2015-06-22 22:52:00
您对utf-8的似乎有误解 而且cmd本来就不是utf-8编码所以显示不出来很正常...
楼主: alphard (阿阿)   2015-06-22 23:11:00
不会耶。在cmd底下打type *.txt >> test原先是UTF-8编码的档案不会有问题,而是原先ansi编码的档案,在汇入test档中,都变成乱码了@@
作者: kyrc (橘子)   2015-06-23 00:11:00
指文通试试 http://hokoy.net/MyApps/Zitong.aspx最后先备分再试,注意事项有特别列出来无法恢复
作者: mybaby520 (麦卑鄙)   2015-06-23 12:01:00
搜寻txt列出全部文字档 拖曳到14.6版以上的Emeditor中Ctrl+F搜寻 规则运算式打勾 搜寻群组中所有文档打勾搜寻\w 按全部抽出 会把非空行的内容全部整并到新文件
楼主: alphard (阿阿)   2015-06-23 20:28:00
楼上大大的方法是可行的,但缺点是有文字档里有些留白的空行都不见了,可否有保留它们的方法。
作者: mybaby520 (麦卑鄙)   2015-06-24 09:42:00
改搜寻\r
楼主: alphard (阿阿)   2015-06-24 22:18:00
再次感谢楼上。另外我发现EmEditor有个功能,把所有目前开启的档案,"用指定编码全部储存",这样便可把所有档案改成UTF-8了。非常方便。
作者: mybaby520 (麦卑鄙)   2015-06-25 09:31:00
咦原来有这功能阿XD 也感谢原PO
作者: oversky0 (oversky0)   2015-06-27 13:33:00
http://totalcmd.net/plugring/EncInfo.htmltotalcmd 加这 plug-in 就可以了。

Links booklink

Contact Us: admin [ a t ] ucptt.com