13

将 UTF-16 文件转换为 UTF-8 的最佳方法是什么?我需要在 cmd 脚本中使用它。

4

6 回答 6

24

有一个 GNU 工具重新编码,您也可以在 Windows 上使用它。例如

recode utf16..utf8 text.txt
于 2008-11-05T19:28:22.640 回答
15

Ruby 的替代方法是用 C# 编写一个小的 .NET 程序(.NET 1.0 会很好,虽然 2.0 会更简单:) - 这是一段非常简单的代码。您是否希望在没有任何其他应用程序的情况下做到这一点?如果您想要一些代码来做到这一点,请添加评论,我会填写答案...

编辑:好的,这没有任何错误检查,但是......

using System;
using System.IO;
using System.Text;

class FileConverter
{
  static void Main(string[] args)
  {
    string inputFile = args[0];
    string outputFile = args[1];
    using (StreamReader reader = new StreamReader(inputFile, Encoding.Unicode))
    {
      using (StreamWriter writer = new StreamWriter(outputFile, false, Encoding.UTF8))
      {
        CopyContents(reader, writer);
      }
    }
  }

  static void CopyContents(TextReader input, TextWriter output)
  {
    char[] buffer = new char[8192];
    int len;
    while ((len = input.Read(buffer, 0, buffer.Length)) != 0)
    {
      output.Write(buffer, 0, len);
    }
  }
}
于 2008-11-05T15:17:41.073 回答
8

当然,最简单的方法是将脚本加载到记事本中,然后使用 UTF-8 编码再次保存。这是另存为对话框中的一个选项。

于 2008-11-05T14:58:42.250 回答
7

也许与iconv

于 2008-11-05T16:59:49.337 回答
4

您可以使用内置的 PowerShell cmdlet 轻松完成此操作,您可以从 cmd 调用它:

C:\> powershell -c "Get-Content mytext.txt | Set-Content -Encoding utf8 mytext_utf8.txt"

编辑:显然,如果您已经在 powershell 中,这将被简化。使用别名也可以简化事情:

> gc mytext.txt | sc -Encoding utf8 mytext_utf8.txt
于 2019-04-22T22:28:28.247 回答
1

如果您安装了 ruby​​ 发行版,则可以调用 ruby​​ 脚本来处理转换:

用于转换文件字符编码的 Ruby 脚本

本着同样的精神:Perl 脚本

在没有脚本支持的情况下,您必须使用 WideCharToMultiByte() 调用像这个C++ 源代码一样对其进行编码......

于 2008-11-05T15:07:49.360 回答