我正在使用扫描仪扫描 Java 中的 .txt 文档。但是,当我在 Eclipse 中打开 .txt 文档时,我注意到一些字符未被识别,它们被替换为如下所示的内容:
�</p>
这些字符甚至不允许我将文件扫描为
while(scan.hasNext)
自动返回 false (如果这些字符不存在,那么我可以很好地扫描文档)。
那么,如何让 Eclipse 识别这些字符以便进行扫描?我无法手动删除它们,因为文档很大。谢谢。
我正在使用扫描仪扫描 Java 中的 .txt 文档。但是,当我在 Eclipse 中打开 .txt 文档时,我注意到一些字符未被识别,它们被替换为如下所示的内容:
�</p>
这些字符甚至不允许我将文件扫描为
while(scan.hasNext)
自动返回 false (如果这些字符不存在,那么我可以很好地扫描文档)。
那么,如何让 Eclipse 识别这些字符以便进行扫描?我无法手动删除它们,因为文档很大。谢谢。
如果您需要更改整个 Eclipse Workspace 的字符编码,请转到 Window -> Preferences。然后在 General -> Workspace 下,将“Text file encoding”更改为适当的字符编码(在本例中为 UTF-8)。
您正在阅读的文件必须包含 UTF-8 或其他一些编码字符,当您尝试在控制台上打印它们时,您会得到一些字符为“.”。这是因为 Eclipse 中默认的控制台编码不是 UTF-8。您需要通过运行配置 -> 通用 -> 编码 -> 从下拉列表中选择 UTF-8 来设置它。检查下面的屏幕截图: