我已经设置了“Nutch 搜索引擎”来抓取网站。现在,我需要编写一个 php API 来与 Nutch 搜索引擎对话。我需要做两件事:
使用 PHP 脚本,我需要向 Nutch 指定要抓取的 URL(为此,我有一些来自 http://www.cs.sjsu.edu/faculty/pollett/masters/Semesters/Fall07/sheetal/?Deliverable2的指针.html
使用 PHP 脚本,我需要从 Nutch 抓取数据库中检索抓取结果。我似乎找不到任何帮助(或者如果答案已经存在,我可能太笨了,看不到答案:()
如果有人使用 PHP API 读取 Nutch 抓取结果,请与我分享一些指针。
绝望地等待一些帮助。