0

有什么方法可以确定网络上的页面是否为保留页面?这是因为作为我的错误处理的一部分,我需要确定是否有任何 curl 收到的页面由于域过期而不可用。

我认为在这种情况下会给出一个不同的 HTTP 代码,但我却得到了 200 OK,这让事情变得很困难。

是在 PHP 中使用 strpos() 搜索特定短语的唯一方法吗?

任何帮助,将不胜感激!

4

3 回答 3

3

没有可靠的方法来做到这一点。有数百个不同的“域保存页面”,它们都没有标准。

归根结底,域名持有页面只是一个与其他页面一样提供服务的网页,它们仅旨在供人类阅读。有些主机根本不会使用一个。

如果您收到一个域名持有页面,状态代码可能是 2xx 代码,但也可能不是。一些主机可能会选择使用 5xx 代码。同样,没有真正的方法可以知道。

于 2011-10-13T11:33:59.480 回答
2

是在 PHP 中使用 strpos() 搜索特定短语的唯一方法吗?

是的。域名持有页面与普通网站没有其他区别。

你可以搜索

  • 某些关键字(“待售”、“为客户保留”......)
  • 某些页面结构(同一家公司持有的许多域共享相同的基本持有页面结构,例如“金发域停车女人”页面)

不过,要达到 100% 的可靠性可能是不可能的。

于 2011-10-13T11:34:26.267 回答
1

有什么方法可以确定网络上的页面是否为保留页面?

从技术上讲,持有页面只是一个页面。所以你在技术上寻找一个页面。但是之后?你能给出任何具体参数什么是控股页面吗?这很难做到。

所以也许它有助于颠倒问题:

有什么方法可以确定网络上的页面是否不是保留页面?

如果您更容易回答这个问题,那么您可能已经找到了一种方法。如果没有,在已经回答的旁边:

  • 保持页面通常看起来相同,具有相同的结构。您可以使用统计数据并确定所有页面中的哪些页面相似。
  • 保留页面可能具有相同的远程 IP 地址。

但具体来说,如果你不能定义一个持有页面的具体特征,你就不能决定一个页面是否是程序化的。

于 2011-10-13T11:45:22.513 回答