我正在尝试在 google 中搜索 url 模式:“/travel-”并将我的搜索结果限制为每个域一个。
这可能吗?
我试过了:
allinurl: "/travel-*"
inurl: "/travel-*"
site: "/travel-*"
不知道如何获得想要的结果...
此外,如果存在具有此功能的另一个 url 爬虫工具,请不要犹豫指出!
谢谢你。
我正在尝试在 google 中搜索 url 模式:“/travel-”并将我的搜索结果限制为每个域一个。
这可能吗?
我试过了:
allinurl: "/travel-*"
inurl: "/travel-*"
site: "/travel-*"
不知道如何获得想要的结果...
此外,如果存在具有此功能的另一个 url 爬虫工具,请不要犹豫指出!
谢谢你。
不确定如何执行与上面的脚本相同的操作,但以下所有操作都可以很好地将其限制为每次搜索的单个响应:
www.google.com/search?q=allinurl%3A+"%2Ftravel-*"&oq=allinurl%3A+"%2Ftravel-*"&num=1
www.google.com/search?q=inurl%3A+"%2Ftravel-*"&oq=inurl%3A+"%2Ftravel-*"&num=1
www.google.com/search?q=site%3A+"%2Ftravel-*"&oq=site%3A+"%2Ftravel-*"&num=1
在接下来的几天里,我将通过 API/arguments 研究一种域限制方法:)
解决方案 0
Web Applications StackExchange 上的这个用户创建了一个 GreaseMoneky 脚本来帮助解决这个问题。
好吧,我写了一个Greasemonkey脚本来解决这个问题, http://userscripts-mirror.org/scripts/show/141480.html。
我没有太多的 JavaScript 经验,但它似乎工作得很好。我仍然很惊讶没有其他人写过这样的东西。这让我快疯了。
有关脚本的更多信息:
解决方案 1
该论坛上的人们建议使用 DuckDuckGo,因为它返回的重复域比 Google 少。旅行查询示例:https ://duckduckgo.com/?q=travel