1

我的下一个重大挑战是编写一个脚本(我假设它会在 AutoIT 中,我没有什么经验)来自动化 Windows 搜索功能。

最终目标是从 .txt 文件中获取搜索词列表(每行一个字符串),并在计算机上每个文档的内容中搜索所述搜索词(一次一个)。

我可以手动实现 - 打开按内容搜索功能,索引所有附加驱动器上的所有文件,逐个搜索术语,然后突出显示全部 > shift-click > 复制为路径 > 粘贴到记事本中,然后另存为[搜索词].txt。

但是,我需要自动化整个过程。我知道我可能需要为要与它一起使用的每个 Windows 版本(XP、Vista、7、8)编写一个单独的脚本。

这是一项很容易完成的任务,还是需要大量的编程时间?谁能指出我正确的方向?感谢所有帮助。

4

1 回答 1

0

好吧,假设您的查询文本文件足够大,并且您不想为每个查询实际迭代整个文件系统,那么您正在描述一个经典的信息检索问题。

  1. 索引文件系统中的数据(这是一个只进行一次的预处理)
  2. 对于每个查询 - 在索引中搜索它,并获取相关文档。

信息检索领域是一个巨大的研究领域,我真的不鼓励您尝试从头开始实施它。

我确实鼓励使用已经为您开发和测试过的内置库。例如,在 java 中,一个流行的选择是lucene——它被广泛用于到处搜索。

如果你不熟悉 java,我也知道这个库的 python ( pylucene ) 和 .NET ( lucene.NET ) 绑定。


要了解有关信息检索的更多信息,我推荐 Manning 的信息检索简介

于 2012-12-19T15:10:30.773 回答