这是一个非常重要的问题,它实际上以编码的形式有一个简单的答案。您面临的问题是您同时使用多种语言。首先是 HTML,然后是 PHP,几秒钟后是 SQL。所有这些语言都有自己的语法规则。
要记住的是:字符串应始终采用正确的编码。
让我们举个例子。您有一个 HTML 表单,用户在其中输入以下字符串:
I really <3 dogs & cats ;')
按下提交按钮后,此字符串将发送到您的 PHP 脚本。让我们假设这是通过 GET 完成的。它被附加到具有自己的语法(例如 & 字符具有特殊含义)的 URL 上,因此我们正在更改语言。这意味着必须将字符串转换为正确的 URL 编码。在这种情况下,浏览器会这样做,但 PHP 也有一个urlencode
功能。
在 PHP 脚本中,字符串存储在 中$_GET
,编码为 PHP 字符串。只要您正在编写 PHP 代码,这完全没问题。但现在让我们将字符串用于 SQL 查询。我们更改语言和语法规则,因此必须通过mysql_real_escape_string
函数将字符串编码为 SQL。
在另一端,我们可能希望再次将字符串显示给用户。我们从数据库中检索字符串,并将其作为 PHP 字符串返回给我们。当我们想将它嵌入到 HTML 中进行输出时,我们再次更改语言,因此我们必须通过htmlspecialchars
函数将字符串编码为 HTML。
在整个过程中,字符串始终处于正确的编码中,这意味着用户可以想出的任何字符都会被相应地处理。一切都应该运行顺利和安全。
要避免的事情(有时甚至是无知的人推荐的)是过早地编码您的字符串。例如,您可以htmlspecialchars
在将字符串放入数据库之前将其应用于字符串。这样,当您稍后从数据库中检索字符串时,您可以将其粘贴到 HTML 中,这没有问题。听起来不错?是的,真的很棒,直到您开始获得人们的支持票,他们想知道为什么他们的 PDF 收据充满了& >
垃圾。
在代码中:
表单.html:
<form action="post.php" method="get">
<textarea name="comment">
I really <3 dogs & cats ;')
</textarea>
<input type="submit"/>
</form>
它生成的 URL:
http://www.example.org/form.php?comment=I%20really%20%3C3%20dogs%20&%20cats%20;')
post.php:
// Connect to database, etc....
// Place the new comment in the database
$comment = $_GET['comment']; // Comment is encoded as PHP string
// Using $comment in a SQL query, need to encode the string to SQL first!
$query = "INSERT INTO posts SET comment='". mysql_real_escape_string($comment) ."'";
mysql_query($query);
// Get list of comments from the database
$query = "SELECT comment FROM posts";
print '<html><body><h2>Posts</h2>';
print '<table>';
while($post = mysql_fetch_assoc($query)) {
// Going from PHP string to HTML, need to encode!
print '<tr><td>'. htmlspecialchars($post['comment']) .'</td></tr>';
}
print '</table>';
print '</body></html>'