问题标签 [character-entities]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
414 浏览

xml - 如何使用 Powershell 使用 XmlUrlResolver 读取包含字符实体的 XML

使用以下 Powershell 行可以正常工作,直到它到达包含字符实体的 XML 文件:

如何使用 Powershell 读取 XML 文件并让它从 DTD 中解析字符实体,而不是生成如下错误:

当 XML 文件有效且不包含字符实体时,读取它们很容易。我在 XML 文件中使用这些字符实体指定了一个 DTD,但它没有使用它。XML 文件的示例开头:

如何在 Powershell 中打开 XML 解析器?DTD 文件与 XML 文件位于同一文件夹中。

我有在 C# 中绕过此问题的代码,但是如何使用 Powershell 执行以下操作?

这是我对执行此操作的 Powershell 代码的最佳猜测,但它仍然无法正常工作。如何使用 Powershell 设置 XmlUrlResolver?

0 投票
1 回答
263 浏览

xslt - DocBook 5 中的“实体 'larr' 未定义”

xsltproc←当我尝试使用在任何 DocBook 5 实体列表中都没有看到的普通左箭头(即 ←)时,会抱怨“实体 'larr' 未定义'” 。我需要包括什么才能让它工作?

我当前的 XSL 是:

...并且 docbook 文件仅以:

...之后我直接进入titleandchapter标签。

我是否需要链接到其他东西才能获得“larr”实体,还是只是从 DocBook 5 中删除?

0 投票
1 回答
517 浏览

perl - Perl 在字符实体引用处拆分字符串  

快速 Perl 问题,希望有一个简单的答案。我正在尝试对包含不间断空格 (  ) 的字符串执行拆分。这是在阅读html页面后使用HTML::TreeBuilder::XPath并检索所需的字符串$titleString = $tree->findvalue('/html/head/title')

下面粘贴的是原始字符串,下面是打印的字符串:

我曾尝试与原版分开$titleString@parts = split('\?',$titleString);也与原版分开nbsp,但都没有奏效。我的预感是要在某处添加一段简单的编码代码?

HTML 代码:

0 投票
0 回答
2748 浏览

php - 是什么以及为什么会在我的 html 输出中造成奇怪的字符

我在 XSL 中有以下代码:

它现在产生以下内容:

在此处输入图像描述

不确定这里发生了什么以及如何删除奇怪的字符。我认为它是一个空间的字符实体?我真的是 xsl 的新手,该怎么做。任何帮助表示赞赏

0 投票
1 回答
1530 浏览

php - 如何将希腊语言的html实体转换为php中的实际符号

我有希腊网站,其中的所有帖子看起来都像:

实际上它在页面上看起来像这样:

Ο Μπόνους Γύρος Drunken Clam θα δείτε θα είναι σε θέση να κερδίζει όσο 1000Χ του συνολικού στοιχήματος επιλέγοντας είτεκα 克利夫兰,彼得,泥潭,

我需要将 html 实体更改为实际符号(我使用的是 UTF-8 编码。)似乎 html_entity_decode() 不这样做。这里有任何图书馆或类似的东西让我能够将文本转换为实际符号。

PHP 版本 PHP 5.3.29

谢谢!

更新:对不起,这是我可耻的错误。我在调试问题时弄乱了 mb_internal_encoding() 和 'default_charset' ini 指令。所以我只需要将 html_entity_decode 工作的编码设置为第三个参数:

正如夏洛特·杜努瓦所写。所以我把她的答案设为正确。

0 投票
1 回答
5371 浏览

python - Python将字符串转换为等效的HTML字符

假设我们有一个字符串

Bruce Wayne is Batman

当我将此字符串转换为 HTML 字符时,输出将是

Bruce Wayne is Batman

我正在尝试在 python 2.7 中找到一种方法。有人可以建议如何做到吗?

我已经搜索了整个 stackoverflow,我找到的所有答案都是如何转义 HTML 特殊字符。我不想转义特殊字符,而是将任何和所有字符串转换为它们的 HTML char 等效项。mozila firefox的hackbar插件能够成功,我想用python来实现。

HTMLParse 库也能够使用 unescape() 模块成功解码它。python中是否有一个库可以按照上面提到的方式对其进行编码?此外,我不是在寻找像 BeautifulSoup 这样的外部库,而是一个内置库,因为它不会向工具添加任何依赖项。

0 投票
0 回答
56 浏览

html - wordpress - 帖子编辑器突然将“<”转换为“<”;。我怎样才能避免这种情况?

我的本地电脑上有一些 wordpress 网站。

有一天我突然没有看到这些图像。

所以,我检查了标记和管理编辑器。

网站标记:

(图片不可见,因为用双引号括起来)

管理员编辑器:当我添加图像时,我可以在编辑器中看到图像。但在发布点击后,图像会在可视选项卡中转换为文本。

并移动到文本选项卡,它看起来像

我的所有网站都显示同样的问题。

我的电脑环境好像有问题。

它与 php.ini 或其他文件的配置有关吗?

我们的团队通过 Git 管理代码。其他工作人员没有任何问题。

所以源代码很好,不需要其他插件。

请帮助我!

  • php版本:7.1.14
  • WordPress 版本:4.9.7
0 投票
3 回答
438 浏览

xml - XSL transform an xml with character entities in element names

My xml looks like:

I am trying to read the element 'street' using the xsl:

but it doesn't give any output.

Why does this happen even though the input xml is in a valid xml format? So how to transform xml files containing character entities for element names?

0 投票
1 回答
237 浏览

html - 编码字符在 HTML 上显示正常,但在 SVG 上显示

我有一个 HTML 页面,其中一个 SVG 元素是通过 javascript 创建的。

如果我在页面的 HTML 部分使用编码字符,例如&#181;/m&#179;,它会完美呈现为 µ/m³

但是,当我将相同的文本放入 SVG 文本元素时,文字&#181;/m&#179;文本会显示在页面上。

整个页面编码为 UTF-8,HTML 和 javascript 文件都以 UTF-8 编码保存。

关于这里会发生什么的任何想法?

编辑:一旦javascript添加了SVG部分,我就会添加页面的完整源代码。这里发生了同样的效果,页面在 svg 部分之前呈现 ok 编码字符,但显示它们在 svg 代码中编码

0 投票
0 回答
788 浏览

xml - XSLT 转换以 ASCII 定义的包含 Unicode 字符实体的文件

我正在尝试处理一个声称(我相信正确)以 7 位 ASCII 本身编码的 XML 文件,但它包含的文本值包含&#215;解析为 Unicode 字符的字符实体。

问题是(我认为)处理器(与 Treebeard 捆绑在一起的 Xalan 版本)正在解析字符实体并将它们变成 gobbledegook,甚至在 XSLT 样式表接触到内容之前。

我在下面整理了一个精简的测试用例-

XML 输入数据

XSLT 样式表

输出 - 注意度数符号(对于华氏度)被破坏

我在编程部分发现了与此类似的问题,一个答案是预处理输入文件以转义或编码字符实体,但在这种情况下,我使用 XSLT“裸”而不涉及其他语言,所以我真的需要一个纯 XSLT 解决方案。

非常感谢答案的想法或链接。

--UPDATE-- 我最初的猜测是错误的。对其他输出格式的一些试验表明(例如)将输出方法设置为 HTML 时,问题字符将作为 HTML 实体输出。这表明字符正在将其转换为未损坏的翻译。我认为它一定是导致问题的输出处理。

根据要求,我取了一小块文本(名称元素的“39°F”部分)并转储了输入和输出字符串的十六进制。

一段文本的十六进制分析

--更新--一些挖掘表明-

  1. 原始工具 (Treebeard) 将输出转换为 UTF-8,但随后: (a) 显示不正确(我认为是 cp1252);(b) 将输出写入文件时将输出转换为 cp1252。
  2. 第二个工具(简单 XSLT 转换)在屏幕上正确显示 utf8 输出,但在写入磁盘时仍转换为 cp1252。
  3. 该站点上的一个线程确认 Java 在启动时采用了默认文件编码。由于这两个工具都是用 Java 编写的,这导致了文件输出问题。

我按照该线程中的建议设置了一个 Windows 环境变量,如下所示:JAVA_TOOL_OPTIONS = Dfile.encoding=UTF8

成功!

该文件被写入 utf8 并且可以在 Notepad++ 或 Excel (PowerQuery) 中成功打开。您必须在 PowerQuery 中手动设置“cp65001”代码页,但它可以工作。

感谢那些回答的人,你帮助我走上了正轨。