问题标签 [google-search-appliance]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
551 浏览

solr - solr 到 gsa(谷歌搜索设备)

我有 100 多个网站依赖于我想用 solr 替换的谷歌设备。我可以在 solr 上管理抓取、索引等,但我真的很想避免更改所有这些网站的代码。我想找到一个看起来像 gsa 的现有包装器,但在引擎盖下使用 solr。有什么建议么?

0 投票
1 回答
1255 浏览

http-headers - 用于限制 Google Search Appliance bot (gsa) 的 HTTP 响应代码

应该使用什么 HTTP 响应代码来限制行为不端的网络爬虫:

是否应该在标题或正文中返回任何解释?

0 投票
1 回答
156 浏览

google-search-appliance - 为什么在使用 Google Search Appliance 编制索引时,属性 google:mimetype 无法处理 Web 内容?

我正在尝试显示由 Google Search Appliance 索引的文档的 mimetype,并且正在使用https://developers.google.com/search-appliance/documentation/connectors/200/connector_dev/cdg_traversinggoogle:mimetype中记录的属性。然而,我使用它的上下文是显示由 web 服务器提供的文档/文件的 mimetype,例如从 web 服务器提供的 PDF 文件,它似乎不起作用,即它不显示 mimetype查看元数据属性。

该属性google:mimetye是否可以与来自 Web 服务器的内容一起使用,不限于文件共享等?

0 投票
2 回答
172 浏览

java - 数据库连接句柄问题

我目前正在使用 Google Search Appliance (GSA) 进行数据库抓取测试,并构建了一个用于处理数据库查询和内容的连接器。

GSA 有一个爬取间隔,这意味着它会重复爬取数据库以进行更新。所以我的问题是:

  • 每次 GSA 抓取数据库时,我应该创建一个连接并关闭它吗?(爬取率非常高,这意味着连接会被重复创建和关闭很多)。

  • 还是我应该只创建一个连接并让它保持为每次爬网查询数据库?问题是我无论如何都没有在系统终止时关闭连接。

或者另一个更好的选择?

0 投票
1 回答
1424 浏览

google-search-appliance - GSA 搜索 - 查询语法

我正在尝试为 GSA 搜索创建查询:

该查询假设将所有结果排除在元标记内的某些文本,例如:

但没有运气。有人知道正确的语法是什么吗?

0 投票
1 回答
178 浏览

asp.net - 将某些 IP 地址视为已登录,以便在 .Net 网站上抓取安全内容

使用表单身份验证的网络网站,将由 Google Mini 设备抓取以进行站点搜索。GMini 有点旧,显然不支持使用表单身份验证抓取网站。据推测,Gmini 不会保留 auth cookie,或者它只是不理解登录表单。

有没有一种方法可以说服 IIS/.Net 将来自 GMini 的 IP 地址的所有请求视为已作为有权访问受保护内容的特定用户登录?

0 投票
1 回答
136 浏览

xml - 如何在 GSA 提要中指定多种语言

我们从我们的应用程序生成 GSA 提要 XML。GSA 使用此 XML 来爬取可用页面。

问题:

我们有英文页面:

http://oursite.com/en/web/design/startpage

德语

http://oursite.com/de/web/design/startpage

是否可以指定: http: //oursite.com/web/design/startpage

并将可用语言指定为属性?

0 投票
1 回答
14686 浏览

java - java JSON文本编码问题

0 投票
2 回答
330 浏览

asp.net - 使用 Google Search Appliance 测试中心作为我自己的 aspx 页面

我将如何使用谷歌在测试中心(我测试我的前端)的视图?

当用户浏览到 site/search.aspx 时,我想要查看测试中心显示、搜索框和所有内容。我还想在页面中添加我自己的 javascript 和 css。这可能吗?

现在我创建了一个带有 updatepanel 的搜索框来显示结果,但是这种方法将迫使我为动态导航进行大量解析和设置变量。即很多逻辑谷歌已经在测试中心服务。

顺便说一句,我不想​​使用支持 GSA 6.14 的 McA+ 库。

0 投票
1 回答
239 浏览

google-search-appliance - 在 Google Search Appliance 上验证搜索参数

在我们所有的网站上,我们都为搜索功能实施了 GSA。最近,该搜索词已被扫描是否存在跨站脚本漏洞。我知道我们可以在将查询发送到 GSA 之前使用 JavaScript 来验证搜索词。但我不确定有多少地方,我们需要实现这一点。

有没有办法可以直接在 GSA 上执行此操作?