问题标签 [google-search-appliance]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
280 浏览

google-search - Google Search Appliance Sharepoint 连接器

GSA SharePoint 连接器如何,我正在尝试将 sharepoint 连接器集成到我们的搜索应用程序中,以在搜索中带来 sharepoint 内容。在这个过程中,我们遇到了很多问题。我想知道 sharepoint 连接器是否是写入选择,因为我们的企业现在开始怀疑搜索结果的可信度。以下是我面临的问题列表:

  1. 零星的搜索结果
  2. 间歇性地抓取不可抓取的网站及其数据
  3. 我们偶尔会收到带有 URL 的 ACL。

我们使用 SAML 进行用户身份验证,使用 ACL 进行早期绑定。我们在 ULF 中实现了连接器身份验证 我们增加了超时
以上调整似乎都没有按功能所需的方式工作。

0 投票
2 回答
1067 浏览

django - 如何在 Google Search Appliance 中索引 Feed?

我在这个网址上有我的原子(大陆列表为 xml),.../continent/search?view=atom如下所示:

当我想在 gsa-interface 中放置和索引我的提要时,我使用了这个:

但是,当我检查传输文件的流量时,它返回 0 文件并出现错误:

对于第二个索引和第三个索引,没有错误,也没有文件!

有什么建议/建议吗?

0 投票
1 回答
1080 浏览

urlencode - Google Search Appliance:当值有括号时如何按部分字段过滤,例如 ()

我们在尝试使用 partialfields 参数搜索具有包含括号的值的元标记时遇到问题。

下面的 URL 是我们在尝试使用以下元标记搜索结果时生成的:

  • department_code=abcxyz
  • region_code=Asia (excl Japan)

我们生成的调用 GSA 的 URL 与此类似:

文档说对名称和值进行双重 URL 编码。我以为我已经做到了。从http://meyerweb.com/eric/tools/dencoder/开始%28region_code%3AAsia+%2528excl Japan%2529%29

单击解码后,我得到:(region_code:Asia %28excl Japan%29)

再次单击解码后,我得到:(region_code:Asia (excl Japan))

对我来说,这听起来像是我已经编码了两次。

我究竟做错了什么?元标记值应该如何在 URL 中编码?

0 投票
1 回答
583 浏览

xml - Confused about different GSA XML feed formats

On this page https://developers.google.com/search-appliance/documentation/64/feedsguide it talks about XML input feeds starting with:

But oddly in the SalesForce connector, the OUTPUT of the SOAP XSLT (which I believe is then sent to Google) looks like:

I believe SaleForce initially returns SOAP XML with its own fields, but then the connector applies the XSLT of your choice to convert it into XML destined for the Google Appliance.

So is the <gsafeed> just a newer dialect of GSA over some older <documents> dialect?

Note: I did search on google, but I keep finding the SalesForce specific doc. And search terms like "documents" aren't very helpful.

0 投票
2 回答
271 浏览

jquery - 如何让我的按钮出现在表单输入框中

在我开始之前,我对不同的方法持开放态度,所以开火吧。此外,我使用的是 Google Search Appliance,因此我几乎无法更改我在这里使用的元素的类、ID 和名称。

我想在搜索表单的文本框中添加一个清除按钮,只是一个灰色的“x”。

表格代码:

我尝试将其附加到搜索框,如下所示:

尽管按钮出现在源代码中,但它根本没有出现,我什至无法获得蓝色轮廓框。

所以我尝试将它附加到另一个输入按钮,如:

除非我将样式设置在输入框上方,否则该按钮会出现,然后如果它在源代码中突出显示,我只会看到蓝色轮廓。

在此处输入图像描述

我尝试像这样设置 z-index 值,但没有运气:

有人对这个问题有创造性的解决方案吗?谢谢。

0 投票
2 回答
280 浏览

google-search-appliance - 自定义文档过滤器 - 启动连接器时出现 ClassNotFoundException

我正在开发一个自定义文档过滤器。到目前为止,我已经在 eclipse 中创建了一个项目,添加了必要的 jar 文件,并使用我自己的文档过滤器成功构建了一个 jar 文件。

让连接器找到课程我缺少什么步骤?

在文件中配置文档过滤器时'connectorInstance.xml'出现问题,似乎在类路径中找不到 jar 文件......

Java 包具有以下类路径:

或者也尝试了以下路径

我将文件复制'DocFilterWildCardSearch.jar'到以下路径:

重新启动连接器并收到以下错误消息:

文档过滤器的配置文件:connectorInstance.xml

0 投票
2 回答
175 浏览

sql-server - Google Search Appliance 已抓取数据库内容的链接失效

我们正在爬取 SQL 服务器以获取员工详细信息。同步完成,数据被抓取和索引。从测试中心搜索员工姓名后,我可以看到结果集,但是当我单击结果集时,它会打开一个类似http://DOMAIN_NAME/db/HOSTNAME/DB_SOURCE_NAME/RANDOM_HASH_ID404 未找到的链接。

但是当我点击缓存时,它会正确显示结果。

0 投票
1 回答
439 浏览

google-search-api - 谷歌搜索引擎自定义 api 对企业的实现?

我最近在印度创办了一家小型 IT 服务公司。一家大企业联系我,要求使用 Google 的自定义搜索引擎 API 设计一个自定义搜索引擎(供内部/网络使用)。

  1. 它必须从一组特定的网站(内部网站/普通网络搜索)中获取信息
  2. 如果在搜索之前选择了一个特定的网站,它应该只显示来自该网站的信息。
  3. 企业有一个可以通过身份验证访问的网页。当用户登录时,搜索也必须从那些经过身份验证的网页中获取信息。
  4. 内容应分为图像、书籍、电影、音乐等。
  5. 键入时自动完成和搜索
  6. 一旦我们完成了这个设计,可能需要使用 phone gap(cordova lib) 将它作为一个 android 应用程序运行。

我的问题:

  1. 谷歌是否允许我为企业做实施(他们准备使用并支付使用谷歌搜索api的使用费),我可以向企业收取实施和支持的费用(我的公司和企业之间会达成协议)?
  2. Google 是否为自定义搜索提供无广告搜索结果?如果不能,我们可以对结果进行限制吗?
  3. 谷歌搜索引擎可以扩展到安卓应用吗?
  4. 如果您对上述问题的回答是“否”,如果我自己开发搜索引擎解决方案,我该怎么做?
0 投票
3 回答
2560 浏览

php - 当 Googlebot 抓取网站时禁用会话

我的 PHP 5.3 服务器使用 use_only_cookies 处理会话,但没有 use_trans_id,会话文件保存在专用目录中。

当 Googlebot 或 Google Search Appliance bot 或任何其他不支持 cookie 的浏览器抓取网站时,会为每个请求的页面创建不同的会话文件。恐怕这些文件会白白占用大量磁盘空间。

是否可以为某些用户代理或不使用 cookie 的浏览器禁用会话文件?我不想用 trans_id 功能替换会话,因为它可能有 SEO 缺点。

是否有 Apache/PHP 指令、设置或任何其他技巧具有以下行为:

  • 如果浏览器不支持 cookie(通过用户代理黑名单或其他方法),那么我们总是使用相同的会话文件,或者我们根本不使用会话文件
  • 对于任何其他浏览器,请使用标准会话文件处理程序。
0 投票
1 回答
7205 浏览

python - 在 Python 3 中从服务器返回回复时引发 BadStatusLine 异常

我正在尝试将脚本移植到 python 3,以提交此处找到的 XML 提要:

https://developers.google.com/search-appliance/documentation/files/pushfeed_client.py.txt

运行 2to3.py 并进行一些小调整以删除任何语法错误后,脚本失败并显示如下:

为什么它会在服务器的响应中返回该异常?当我嗅探会话时,这是 GSA 的完整回复:

它确实返回了 HTTP 400。只要 XML 有效负载中包含 utf-8 字符,我就可以可靠地导致此问题。当它是普通的 ascii 时,它可以完美地工作。这是我可以用来可靠地重新创建问题的最基本的代码版本:

这是一个用于导致异常的示例 XML 有效负载:

我可以在 2 和 3 版本之间找到的唯一增量是每个请求的内容长度标头。Python 3 版本始终比 2 版本短,870 与 873。