我正在以编程方式与搜索引擎进行交互,我需要让它认为我是一个进行查询的人,而不是一个机器人。这涉及生成任何普通用户都可以搜索的查询,例如“ncaa 足球赛程表”或“登月是什么时候?” 我每天会进行一千多个这样的查询,并且从字典中搜索随机单词不会减少它,因为这不是一个非常典型的搜索习惯。
到目前为止,我已经想到了几种生成真实查询的方法:
- 获取当天最热门的 google(或 Yahoo 或 Bing 等)搜索列表
- 通过从字典中输入一个随机单词,后跟一个空格并抓取推荐的查询,从而利用 Google 的自动完成功能。
后一种方法听起来会涉及大量的逆向工程。使用前一种方法,我无法找到超过 80 个查询的列表——我发现的唯一来源是AOL 趋势(50-100) 和Google 趋势(30)。
我该如何生成大量类似人类的搜索短语?
(对于任何与语言相关的答案:我正在用 Python 编程)