0

我想创建一个机器人。有人会键入“!123”,机器人将在存储库中搜索值“123”并返回(粘贴)为该值找到的信息。我希望这是通用的……意味着它可以在任何地方使用,所以可能是某种 Firefox 插件。

有人可以向我提供有关我可以从哪里开始的信息吗?

我对 c# 和 java 编程有一定的了解。

Ps 无意成为某种垃圾邮件机器人,我只想收集人们可以轻松引用的信息。

4

1 回答 1

0

您的项目有多个部分。

  1. 机器人将从网络上抓取数据并将数据保存在数据库中。(假设您正在考虑从 Web 构建您的存储库)。谷歌网络爬虫/刮板
  2. 数据提取器/清理器,它将清理数据并提取有关特定文档的相关信息。(这很重要,以便您可以标记相关信息的信息)
  3. 然后是搜索引擎部分,它使您能够从存储库中检索相关数据。尝试 向量相似度算法
于 2013-10-14T09:50:55.237 回答