13

我正在使用扫描仪扫描 Java 中的 .txt 文档。但是,当我在 Eclipse 中打开 .txt 文档时,我注意到一些字符未被识别,它们被替换为如下所示的内容:

�</p>

这些字符甚至不允许我将文件扫描为

    while(scan.hasNext)

自动返回 false (如果这些字符不存在,那么我可以很好地扫描文档)。

那么,如何让 Eclipse 识别这些字符以便进行扫描?我无法手动删除它们,因为文档很大。谢谢。

4

2 回答 2

23

如果您需要更改整个 Eclipse Workspace 的字符编码,请转到 Window -> Preferences。然后在 General -> Workspace 下,将“Text file encoding”更改为适当的字符编码(在本例中为 UTF-8)。

Eclipse 首选项 - 更改字符编码

于 2014-02-28T16:44:01.417 回答
22

您正在阅读的文件必须包含 UTF-8 或其他一些编码字符,当您尝试在控制台上打印它们时,您会得到一些字符为“.”。这是因为 Eclipse 中默认的控制台编码不是 UTF-8。您需要通过运行配置 -> 通用 -> 编码 -> 从下拉列表中选择 UTF-8 来设置它。检查下面的屏幕截图:

在此处输入图像描述

于 2013-06-30T00:12:57.133 回答