0

我正在建立一个推荐其他好网站的网站。

因此,我使用爬虫系统收集了很多网站。

现在,我正在尝试使用 PHP 来区分网站是否有好词。

$page_content = file_get_contents($url);
$bad_word = 'damn';

if(strstr($page_content, $bad_word)):
    $result = 'YES';
else:
    $result = 'NO';
endif;

我的代码是这样的。

我使用 Codeigniter 并收到此消息。

An Error Was Encountered

Unable to load your default controller. Please make sure the controller specified in your Routes.php file is valid.

它适用于某些网站,但不适用于其他网站。

有没有其他方法可以检索网站的内容?

4

2 回答 2

1

我昨天已经回答了类似的帖子,但又来了:) 你可以使用 preg_match() 获得更好的结果。preg_match 不仅仅包含正则表达式。它可以完全满足您的需求。IE:

if (preg_match("/bad-word/i", "page written content of many good and bad words")) {
    $result = 'YES';

} else {
     $result = 'NO';

}

“i”表示区分大小写,更多示例请查看 PHP 手册:http: //php.net/manual/en/function.preg-match.php

于 2012-06-11T05:34:53.293 回答
0

有些网站需要通过 cURL 提交表单。

于 2012-06-11T05:29:41.060 回答