问题标签 [character-reference]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
275 浏览

html - 不允许十进制数字字符引用:禁止还是文本?

根据HTML 5.1 规范:: Decimal numeric character reference:

& 号后面必须跟一个“#”(U+0023) 字符,后面跟一个或多个 ASCII 数字,代表一个以十为基数的整数,对应于根据以下定义允许的 Unicode 代码点。数字后面必须跟一个“;” (U+003B) 字符。

及以下:

上述数字字符引用形式允许引用除 U+0000、U+000D、永久未定义的 Unicode 字符(非字符)、代理项 (U+D800–U+DFFF) 和空格以外的控制字符以外的任何 Unicode 代码点人物。

我很困惑。这是否意味着(粗体文本)不能引用的字符(如 U+000 或 U+00D)被禁止或仅视为文本,而不是引用?

TL;DR我应该对无法像引用一样引用的实体抛出验证错误,
还是将它们视为文本?

0 投票
2 回答
1307 浏览

character-encoding - 如何在Java中使用数字字符引用转义字符串

您好,感谢您阅读我的帖子。

Apache Commons StringEscapeUtils.escapeHtml3() 和 StringEscapeUtils.escapeHtml4() 函数特别允许将字符串中带有尖音符(如 é、à...)的字符转换为具有 &name; 格式的字符实体引用。其中 name 是区分大小写的字母数字字符串。

如何使用数字字符引用获取给定字符串的转义字符串(&#nnnn; 或 &#xhhhh; 其中 nnnn 是十进制形式的代码点,hhhh 是十六进制形式的代码点)?

我实际上需要为一个不知道 & eacute; 和 & agrave; 等实体的 XML 文档转义字符串。等等

此致。

0 投票
0 回答
257 浏览

python - Python xml:以十六进制形式编码数字字符引用

我有许多脚本可以获取外部数据并更新部分 xml 文件。

我在我的 python 脚本中使用 lxml,它以十进制表示法保存字符引用,例如:

而其他脚本使用十六进制形式:<record text="&#x41f;&#x440;&#x438;&#x432;&#x435;&#x442;">因此即使没有实际更改,git 也会对这些文件进行无穷无尽的更改。

如何告诉 lxml&#x41f;在 python 脚本中以十六进制形式 () 保存字符引用?

0 投票
1 回答
69 浏览

c# - 有没有办法让 XmlReader 将字符引用保留为文本而不是转换它?

我正在使用 xml 阅读器来解析一些 xml,我想知道是否可以让它在字符实体引用中作为纯文本读取,而不是将其转换为实际字符。因此,如果我在节点上调用 ReadInnerXml():

我会得到“不要&apos;转换这个”,而不是我目前得到的“不要转换这个”。这是必要的,因为任何字符或字符实体引用都应按原样返回,因为它们是遗留内容。

任何帮助表示赞赏!

0 投票
1 回答
65 浏览

python-3.x - lxml - 保留输入符号,禁用实体转换

如果使用 lxml 读取并输出以下字符串,则元音变音将转换为实体。

输出:

<r><s>Die H&#228;user haben D&#228;cher.</s></r>

预期输出:

<r><s>Die Häuser haben Dächer.</s></r>

变音符号只是一个例子。我通常想禁用实体转换,而是保留原始输入符号。

我可以禁用实体转换吗?有没有一种安全的方法来重新转换实体?

0 投票
1 回答
101 浏览

php - 如何使用 PHPUnit 测试 Symfony 中的字符引用?

我想测试我的 PHP/Symfony 项目生成的这个非常简单的页面

(它是法语,所以它需要&nbsp;感叹号前面的硬空格。)

我认为一个同样简单的测试,例如

会做的伎俩,但我失败了。

进一步调查表明

返回

那么,我如何帮助assertSelectorTextContains()(更一般地说,PHPUnit)理解两个字符串实际上是相同的?(或者至少是等价的?)

0 投票
0 回答
34 浏览

python - shell脚本中的字符串解码

是否可以使用 shell 脚本解码字符串?例如,解码这个字符串

会给我们“星巴克”。我使用https://coderstoolbox.net/string/#!encoding=xml&action=encode&charset=none进行解码。有什么方法可以使用 Shell 脚本或 python 进行解码吗?请帮我。