我想编写一个脚本来确定链接到我的网站的其他域的超链接的位置。例如,我想知道链接是否来自“文章内”、“侧边栏内(左/右)”、“页脚内”。我能想到的唯一方法是检查包装链接的 CSS 类。例如,一个链接在“left_sidebar”类中,那么它很可能在左侧边栏中:) 但这似乎是一种确定这一点的错误方法。这可能适用于精心设计的 Wordpress 主题,但不适用于许多其他网站。
那么有没有更好的方法来做到这一点?谢谢!
我想编写一个脚本来确定链接到我的网站的其他域的超链接的位置。例如,我想知道链接是否来自“文章内”、“侧边栏内(左/右)”、“页脚内”。我能想到的唯一方法是检查包装链接的 CSS 类。例如,一个链接在“left_sidebar”类中,那么它很可能在左侧边栏中:) 但这似乎是一种确定这一点的错误方法。这可能适用于精心设计的 Wordpress 主题,但不适用于许多其他网站。
那么有没有更好的方法来做到这一点?谢谢!
PHP 真的没有办法做你想做的事。正如您所说,您提出的方法不是很可靠,因为网页设计师可以在没有标准的情况下随意命名他们的 div。这可能是获取所需信息的最佳方式。我不得不问自己,我对数据的需求有多糟糕,并确保在我拥有数据后能很好地利用它,然后再努力让它发挥作用。
有更多创造性的方法来实现我认为你正在努力的目标。与其根据部分来思考,不如考虑上下文。如果一个链接驻留在 ap 标签中并带有相当数量的附加文本,我们可以推断它是一篇文章的一部分,而不是一组链接。
结合一组这些推论,增加权重,你就可以开始构建可以微调的东西了。