Linux下GBK文件编码批量转换UTF-8

发表于2019-02-18 分类于 Shell 阅读次数：阅读次数：本文字数： 551 阅读时长 ≈ 1 分钟

Windows默认是GBK编码格式，Linux默认是UTF-8的格式，不同格式之间的乱码处理。

1	enca -L zh_CN -x UTF-8 *.c

enca – 文件编码

1
2
3

$enca -h
Usage:  enca [-L LANGUAGE] [OPTION]... [FILE]...
        enconv [-L LANGUAGE] [OPTION]... [FILE]...

用法：

1
2
3

$ enca -L zh_CN file      检查文件的编码
$ enca -L zh_CN -x UTF-8 file 将文件编码转换为"UTF-8"编码
$ enca -L zh_CN -x UTF-8 file1 file2 如果不想覆盖原文件可以这样

1	$ convmv -f 源编码 -t 新编码 [选项] 文件名

-r 递归处理子文件夹
–notest 真正进行操作，请注意在默认情况下是不对文件进行真实操作的，而只是试验。
–list 显示所有支持的编码
–unescap 可以做一下转义，比如把%20变成空格

示例：

1	$ convmv -f GBK -t UTF-8 --notest utf8 filename

1	$ find default -type f -exec convmv -f GBK -t UTF-8 --notest utf8 {} -o utf/{} \;

批量处理