2

我正在尝试在 google 中搜索 url 模式:“/travel-”并将我的搜索结果限制为每个域一个。

这可能吗?

我试过了:

allinurl: "/travel-*"

inurl: "/travel-*"

site: "/travel-*"

不知道如何获得想要的结果...

此外,如果存在具有此功能的另一个 url 爬虫工具,请不要犹豫指出!

谢谢你。

4

2 回答 2

1

不确定如何执行与上面的脚本相同的操作,但以下所有操作都可以很好地将其限制为每次搜索的单个响应:

www.google.com/search?q=allinurl%3A+"%2Ftravel-*"&oq=allinurl%3A+"%2Ftravel-*"&num=1

www.google.com/search?q=inurl%3A+"%2Ftravel-*"&oq=inurl%3A+"%2Ftravel-*"&num=1

www.google.com/search?q=site%3A+"%2Ftravel-*"&oq=site%3A+"%2Ftravel-*"&num=1

在接下来的几天里,我将通过 API/arguments 研究一种域限制方法:)

于 2014-10-27T14:17:55.440 回答
1

解决方案 0

Web Applications StackExchange 上的这个用户创建了一个 GreaseMoneky 脚本来帮助解决这个问题。

好吧,我写了一个Greasemonkey脚本来解决这个问题, http://userscripts-mirror.org/scripts/show/141480.html

我没有太多的 JavaScript 经验,但它似乎工作得很好。我仍然很惊讶没有其他人写过这样的东西。这让我快疯了。

通过https://webapps.stackexchange.com/questions/30015/prevent-many-results-from-same-domain-in-google-search

有关脚本的更多信息:

解决方案 1

该论坛上的人们建议使用 DuckDuckGo,因为它返回的重复域比 Google 少。旅行查询示例:https ://duckduckgo.com/?q=travel

于 2014-10-27T13:42:33.407 回答