-1

我在 ubuntu 上使用 nutch 和 solr。我想使用 php 来查询数据库或其他方法,以从索引页面返回一组链接,这些链接指向任何特定的 url 或域。请指出我正确的方向。

我使用本教程设置蜘蛛http://nlp.solutions.asia/?p=180

我还想指出,首选是 php 语言选项或通过 php curl 或命令行界面与 nutch 或 sorl 应用程序的 api 接口。谢谢

4

1 回答 1

0

我注意到在数据库内部存储了链接,因此在解析每一行的链接后,执行以下查询将获得到 creativecommons.org 域的索引入站链接:

SELECT * FROM pages WHERE inlinks LIKE '%creativecommons.org%'

于 2013-03-17T04:44:40.173 回答