3

如果您将以下文本复制并粘贴到 html 页面中,

انوان

您将看到以下阿拉伯文文本:

回复

我的问题是:

这种包含数字和井号 (#) 符号的编码类型的名称是什么,以及如何在 PHP 中对其进行解码?

4

4 回答 4

8

这些是... HTML 实体(或挑剔者的“数字字符引用”)。

试试html_entity_decode

例子:

$foo = html_entity_decode('انوان');
// gives you the arabic words in $foo

(如果字符串是ا...你需要申请html_entity_decode两次的形式。(我不知道codaddict的编辑是否有效。))

于 2010-03-06T06:49:21.907 回答
3

这些字符被称为HTML 实体。基本上,它们是一种更安全的表示字符的方式,例如&在 HTML 中可能具有含义的其他符号。所有字符都有一个对应的 HTML 实体。

您可以使用 PHP 对它们进行解码html_entity_decode

于 2010-03-06T06:50:10.503 回答
0

您可以使用 convert_uudecode() 函数进行解码。

<?php
echo convert_uudecode("+22!L;W9E(%!(4\"$`\n`"); //It prints I love PHP!
echo "\n";
echo convert_uudecode('&#1575;&#1606;&#1608;&#1575;&#1606;'); //It prints WU±
?>
于 2010-03-06T10:01:01.227 回答
0

要使用正确的术语:

  • &amp;是一个实体引用,它引用名为amp的实体。
  • &#1575;是一个字符引用,它引用 Unicode 字符集中的字符 U+0627(十进制的 1575)。

两个引用都是字符引用,因为它们只引用单个字符。但实体也可以表示不止一个字符。

于 2010-03-06T10:20:48.220 回答