我希望此脚本从文本文件中读取每一行(都是 url)并对其进行解析以检查该特定网站的任何 url 中是否存在两个给定的单词。我还希望文本文件中的所有 url(行)都按序列号打印。此代码找出这两个词,但我不确定它们是否来自该站点的同一网址。它显示给定单词出现的次数而不是序列号。
<?php
$mysearch = file("phpelist.txt");
for($index = 0; $index <count($mysearch); $index++)
{
$mysearch[$index] = str_replace("\n", "", $mysearch[$index]);
$data = file_get_contents("$mysearch[$index]");
$searchTerm1 = 'about';
if (stripos($data, $searchTerm1) !== false) {
echo "$counter$.mysearch[$index]... FOUND WORD $searchTerm1<br>";
$searchTerm2 = 'us';
if (stripos($data, $searchTerm2) !== false) {
echo "... FOUND WORD $searchTerm2<br>";
}
}
else
{
echo "<br>";
echo "$mysearch[$index]...not found<br>";
}
}
?>
脚本的输出如下:
'url1'...未找到
'url2'...未找到
'url3'...未找到
'url4'...未找到
'url5'...未找到 $.mysearch[5]... 找到有关... 找到我们 $.mysearch[6] 的字... 找到有关... 找到我们 $.mysearch[7] 的字... 找到关于... 找到我们的词
'url6'...未找到 $.mysearch[9]... 找到关于... 找到我们 $.mysearch[10]... 找到关于... 找到我们 $.mysearch[11] 的字... 找到有关 ... 找到我们 $.mysearch[12] 的字... 找到有关... 找到我们 $.mysearch[13] 的字... 找到有关... 找到我们的字