7

我目前正在开发一个从暴雪社区 API 提取 JSON 数据并使用 PHP 解析它的应用程序。一切正常,直到我遇到一个名字中有特殊字符的角色。

为了提取角色数据,我需要知道他们的角色名称和他们所在的领域。

我通过 URL 将名称和领域传递到角色页面,并从那里使用该信息提取角色数据。

此时我的网址是这样的:

 http://localhost/guildtree/characters.php?realm=argent-dawn&name=Ankzu

此时,如果我尝试提取带有重音符号的字符的数据,我将被重定向到我的错误页面,因为它不是有效字符。

直到我开始 URL 重写,我才发现我的问题。我被重新定向到我的错误页面,因为沿线的某个地方,特殊字符正在被一些非常不稳定的字符替换。

使用我新重写的 URL,以下工作:

 http://localhost/guildtree/argent-dawn/ankzu

但是,名称中带有特殊字符的字符会导致错误消息。

 http://localhost/guildtree/argent-dawn/notúk

导致以下错误消息:

“未找到

在此服务器上未找到请求的 URL /guildtree/argent-dawn/notúk。”

如您所见,ú 被替换为ú,但是当我复制并粘贴 URL 时,ú 显示为 %C3%BA

据我了解,ú 显示为 ú 的原因是因为两个字节的 unicode ú 被压缩成两个一个字节的 ASCII 字符,导致显示 ú。

我确保我的所有页面的标题中都有以下内容:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

为了让我的应用程序正常工作,我需要那些特殊字符才能正确显示,所以我需要 ú 实际显示为 ú,而不是显示为 ú 但实际上是 ú 或 %C3%BA。

字符名称是从 URL 中提取的,如下所示:

$charName = $_GET['name'];

是否可以对 $charName 进行编码以正确显示特殊字符?

我已经尝试了所有我能想到的并在谷歌上搜索过,但没有任何效果。

另外,因为我正在使用 URL 重写,所以重写规则允许这些特殊字符是什么?

这是我当前的重写规则:

 RewriteRule ^([a-zA-Z0-9_'-]+)/([a-zA-Z]+)$        characters.php?realm=$1&name=$2     [NC]

我知道 ([a-zA-Z]+) 根本不允许特殊字符,我目前一直在努力让特殊字符正确显示。如果我使用 ([a-zA-Z\ú]+) 它将工作并显示需要显示的页面。将 \ú 添加到规则中似乎是一种非常糟糕的方法,并且在使用重音字符的相应字符时并不总是有效。

任何帮助将不胜感激。如果您需要更多信息,请询问。

编辑:

将我的重写规则更改为以下可以很好地提取信息,但会为我的 CSS 创建一个重定向循环。

 RewriteRule ^([a-zA-Z0-9_'-]+)/([^/]+)$        characters.php?realm=$1&name=$2 [NC]

例如我的 CSS 被重定向到

http://localhost/guildtree/css/error

代替

http://localhost/guildtree/css/style2.css

更新:

通过几个简单的测试:

$charName = $_GET['name'];
$charNameTEST = utf8_encode($charName);

将进行更改,但是当我将其应用于我的页面时,它仍然会出现:

“未找到

在此服务器上未找到请求的 URL /guildtree/argent-dawn/notúk。”

我认为现在的主要问题是 URL 重定向,因为当 JSON 数据具有重音字符时,它可以很好地解析。我只是不明白为什么它一直向我显示它在浏览器栏中的 guildtree/argent-dawn/notúk 上,但一直试图拉起 /guildtree/argent-dawn/notúk。

4

3 回答 3

3

对于 URL,ú 不是有效字符。

无论您在何处链接用户名,都应该对其进行 URL 编码。

因此,要指向的正确 URL 是:

http://localhost/guildtree/argent-dawn/not%C3%BAk

您应该在 php 中将其打印为:

echo '<a href="http://localhost/guildtree/argent-dawn/'. urlencode($name) .'">Link</a>;
于 2012-08-24T14:54:07.443 回答
2

要使其正常工作,您需要做两件事。

首先将此添加到您的 .htaccess

AddDefaultCharset On
AddDefaultCharset UTF-8
AddCharset UTF-8 .tpl
AddCharset UTF-8 .js
AddCharset UTF-8 .css
AddCharset UTF-8 .php

其次,更改重写规则中需要允许特殊字符 (.*) 的部分,如下所示:

 RewriteRule ^([a-zA-Z0-9_'-]+)/(.*)$       characters.php?realm=$1&name=$2     [NC]

这将导致其他页面出现一些重定向循环,但我目前正在努力解决这个问题。

于 2012-08-24T20:50:41.063 回答
2

我想这个问题可能有你的答案。我自己没有尝试过,但据我所知,您需要将您的 RewriteRule 重写为:

RewriteRule ^([a-zA-Z0-9_'-]+)/([a-zA-Z]+)$        characters.php?realm=$1&name=$2     [NC,B]

B标志将确保特殊字符是 URL 转义的,因此 $2 中 name 看到的值将是百分比编码的。由于您没有进行重定向,因此原始 unicode 字符应该仍然是 URL 中显示的内容。

您还需要对正则表达式进行一些更改,以确保它与 unicode 字符匹配。我不确定那些会是什么。

这里还有更多关于unicode 字符在 URL 中的工作方式的描述。

于 2012-08-24T15:02:44.273 回答