1

我正在运行一系列正则表达式替换(即 String.replaceAll 调用)以将文本文件中的所有特殊字符转换为 XML 可解析的特殊字符。例如:

string_out = string_out.replaceAll("&", "&");

我遇到了替换“节字符”的绊脚石,即这个小曲线:§

对于初学者,我在 vi 中进行编辑,所以我什至无法将字符粘贴到那里,它不是标准或扩展 ascii 的成员。出于同样的原因,我也看不到在正则表达式中通过十六进制代码指定它。

您将如何为正则表达式替换指定此字符?或者,如果你只是想顺便告诉我已经有一个函数隐藏在某个地方来进行我正在手动进行的字符转换,那也很酷。

4

2 回答 2

4
Unicode: §
Hex:     0xA7
html:    §
name:    section sign

您可以在latin-1 补充资料中找到它。

于 2010-08-19T17:43:40.033 回答
0

你不能简单地使用 unicode 代码点吗?

于 2010-08-19T17:43:21.953 回答