1

我需要从页面上的数据库中提取内容,但是其中一些内容具有整个 HTML 页面 - 带有 css、head 等...

防止拥有所有 htlm 标签、脚本、css 的最佳方法是什么?iframe 在这里有帮助吗?

最令人烦恼的是我在页面上得到了奇怪的字符:� 并且发现这是由于不同的编码。

该网站有 utf-8 编码,如果内容包含不同的编码,这些标志就会出现,我无法替换它们。它使它们删除的唯一一件事是更改我的编码,但这不是真正的解决方案。

如果有人能告诉我如何删除它们,那就太好了。

解决方案:在您的帮助下,我检查了编码,但无法更改。我将 mysql_query 中的名称设置为 UTF-8,并去除了无用的标签。现在看来还可以。感谢大家。

4

2 回答 2

2

我认为你没有机会分开一个丑陋的 iframe。关于编码,你应该检查db encoding,connection encoding并根据需要进行转换。用于iconv完全控制转换,例如:

$html=iconv("UTF-8", "ISO-8859-15"."//TRANSLIT//IGNORE",$html]);

在这种情况下,您将丢失一些未在 ISO-8859-15 中映射的字符。考虑将您的整个站点转为 UTF-8 编码。

于 2013-04-02T11:14:14.570 回答
1
于 2013-04-02T11:16:44.877 回答