大家好,我知道在tty显示中文很麻烦,所以我想知道在乱码背后的显示模式
问题是这样的:
我有50万个档案要处理,格式大概是 501025_ID.txt
因为一开始没限制作业ID只能用英文,所以有几个中文ID混入
LINUX显示如下
502222_123.txt
503312_??+??.txt (为中文所显示的乱码)
507832_cher.txt
503878_-?{D.txt (为中文所显示的乱码)
要把中文的ID换成英数比较好处理
所以我用 find . -regextype egrep -regex ".*_[^[:alnum:]].*"
或是改用