根据ISO-8859-1标准的下表,每个保留的 HTML 字符似乎都有一个实体名称和一个实体编号。
例如,对于字符é
:
实体名称 :é
实体编号:é
同样,对于字符>
:
实体名称 :>
实体编号:>
对于给定的字符串,HttpUtility.HtmlEncode
返回一个 HTML 编码的字符串,但我不知道它是如何工作的。这就是我的意思:
Console.WriteLine(HtmlEncode("é>"));
//Outputs é>
它似乎使用角色的实体编号,但é
角色的实体名称>
。
那么 HtmlEncode 方法真的适用于 ISO-8859-1 标准吗?如果是这样,它有时使用实体名称而有时使用实体编号是否有原因?更重要的是,我可以强制它可靠地给我实体名称吗?
编辑: 谢谢你们的回答。我无法在执行搜索之前解码字符串。在不涉及太多细节的情况下,文本存储在 SharePoint 列表中,“搜索”由 SharePoint 本身完成(使用 CAML 查询)。所以基本上,我不能。
我正在尝试将实体编号转换为名称的方法,.NET 中是否有这样做的功能?还是有其他想法?