3

使用 Shift-JIS 字符集创建文件时遇到问题。

这是我要写入 txt 文件的文本示例:

缲戻_日経选挙システム维护2019年1月10日~;[2019年度更新]横浜第1DCコロケ―ション(2ラック)

使用 Shift-JIS 字符集,在文件中我找到两个“?” 而不是 ~ 和 ―:

缲戻_日経选挙システム维护2019年1月10日?;[2019年度更新]横浜第1DCコロケ?ション(2ラック)</p>

使用 UTF-8 字符集,进入我找到的文件(全部正确):

缲戻_日経选挙システム维护2019年1月10日~;[2019年度更新]横浜第1DCコロケ―ション(2ラック)

这是我的代码:

package it.grupposervizi.easy.ef.etl.elaboration;

import com.nimbusds.jose.util.StandardCharset;
import java.io.File;
import java.io.IOException;
import java.nio.charset.Charset;
import java.util.Arrays;
import java.util.List;
import org.apache.commons.io.FileUtils;

public class TestShiftJIS {

  private static final String TEXT = "繰戻_日経選挙システム保守2019年1月10日~;[2019年度更新]横浜第1DCコロケ―ション(2ラック)";
  private static final String DIRECTORY = "C:\\temp\\japan\\";
  private static final String SHIFT_JIS = "Shift-JIS";
  private static final String UTF_8 = StandardCharset.UTF_8.name();
  private static final String EXTENSION = ".txt";

  public static void main(String[] args) {

    final List<String> charsets = Arrays.asList(SHIFT_JIS, UTF_8);
    charsets.forEach(c -> {
      final String fName = DIRECTORY + c + EXTENSION;
      File file = new File(fName);
      try {
        FileUtils.writeStringToFile(file, TEXT, Charset.forName(c));
      } catch (IOException e) {
        throw new RuntimeException(e);
      }
    });

    System.out.println("End Test");
  }
}

您知道为什么这两个字符不包含在 Shift-JIS 字符集中吗?

4

3 回答 3

1

///编辑:

您尝试保存具有不常见(不同于默认)编码的文件。尝试更改字符的编码。有关编码的更多信息 » https://en.wikipedia.org/wiki/Character_encoding

///

尝试使用:Charset.forName("CP943C")

于 2021-08-11T17:36:22.573 回答
0
于 2020-09-02T14:53:57.797 回答
0
于 2020-12-09T14:12:54.237 回答