Follow Excellent, Success will Chase you

0%

Linux下GBK文件编码批量转换UTF-8

Windows默认是GBK编码格式,Linux默认是UTF-8的格式,不同格式之间的乱码处理。

1
enca -L zh_CN -x UTF-8 *.c

enca – 文件编码

1
2
3
$enca -h
Usage: enca [-L LANGUAGE] [OPTION]... [FILE]...
enconv [-L LANGUAGE] [OPTION]... [FILE]...

用法:

1
2
3
$ enca -L zh_CN file      检查文件的编码
$ enca -L zh_CN -x UTF-8 file 将文件编码转换为"UTF-8"编码
$ enca -L zh_CN -x UTF-8 file1 file2 如果不想覆盖原文件可以这样

convmv – 文件名编码

1
$ convmv -f 源编码 -t 新编码 [选项] 文件名
  • -r 递归处理子文件夹
  • –notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
  • –list 显示所有支持的编码
  • –unescap 可以做一下转义,比如把%20变成空格

示例:

1
$ convmv -f GBK -t UTF-8 --notest utf8 filename

1
$ find default -type f -exec convmv -f GBK -t UTF-8 --notest utf8 {} -o utf/{} \;

批量处理

-------------本文结束感谢您的阅读-------------
  • 本文作者: Winddoing
  • 本文链接: https://winddoing.github.io/post/38869.html
  • 作者声明: 本博文为个人笔记, 由于个人能力有限,难免出现错误,欢迎大家批评指正。
  • 版权声明: 本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!