问题标签 [google-search-appliance]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
jquery - GSA 搜索建议为 jQuery 插件使用 ss.js 或 Ajax Autocomplete
我正在尝试为我的 gsa 搜索框实施搜索建议,如 http://code.google.com/apis/searchappliance/documentation/612/xml_reference.html#QuerySuggestionServicesuggestProtocol中所述
我在集成他们提到 ss.js 的 javascript 文件时遇到问题,因为该文件显然对 lint 不是很友好。
我查看了 http://briancaos.wordpress.com/2010/07/16/gsa-google-search-appliance-suggest-using-c-and-jquery/,他们提供了使用 jquery 插件的替代解决方案。
我环顾四周,似乎没有太多关于如何实现这个 ss.js 文件的参考。我想知道是否有人可以给我一个额外的信息,说明哪个可能更好用以及为什么。
这是一个使用 C# 的 .net 项目。
search - 是否有可供测试的 Google Search Appliance 图像?
我被要求将一些 Web 表单从使用 Google Site Search 调整为 GSA。目标服务器被锁定,以至于我无法轻松测试功能。因此,我想知道是否有办法在本地开发环境中模拟 Google Search Appliance?
Onebox模拟器会为我提供这个吗?
iframe - 使用 iframe 显示 google mini 搜索结果
我只想在提交搜索表单后显示包含搜索结果的 iframe,但是我不确定如何执行此操作,因为 $_GET 变量对我的脚本不可用,所以我不能这样做
如何捕获从 google mini 返回的搜索结果(到文件)以显示为包含在网页中,或者如何捕获此页面的提交事件,我可以将其用作显示包含搜索的 iframe 的条件结果?
非常感谢
google-search - 谷歌搜索未返回索引的 PDF 文件
正如标题所示,我已经设法配置我的 GSA 来抓取我的 PDF 文件。它们显示在带有指向它们的链接的列表页面上,以便可以抓取 URL 并将其添加到特定集合中(在此帖子中称为“我的 PDF”)。
抓取成功,我可以在“My-PDFs”集合的 GSA 抓取诊断中看到以下内容:
抓取诊断
单个文件的抓取诊断:
有关此页面的更多信息
- 链接到此页面
- 缓存版本不可用
- PageRank:不可用
- 最后修改:
- 此页面上已抓取页面的链接数:未知
- 链接到该页面的已抓取页面数:未知
- 此页面位于以下集合中:
- 我的 PDF
但是,当使用 GSA 测试中心对同一个“我的 PDF”集合进行搜索时,PDF 文件将不会返回。我确保在测试中心使用适当的前端选择,以及正确的集合('My-PDFs'),然后使用文档中的关键字。我也尝试过使用文档的文件名,但仍然没有结果。我总是得到:
您的搜索 - TestKeyword - 没有匹配任何文档。
找不到包含“TestKeyword”的页面。
(显然,使用实际的关键字)
有任何想法吗?
注意:使用 GSA 5.0。
database - Google Search Appliance 数据库供稿
我是第一次为工作设置 GSA 盒子。我已经建立了与成功爬取所有行的数据库(用于人员搜索)的连接。然后它为我创建了一个提要,但总是在日志中返回“错误失败”并显示以下内容:
所以我尝试将数据库添加到爬网列表中(即来自数据库的 Google Search Appliance 索引内容)。但这总是会回来
我一生都无法弄清楚该放入该部分的内容。我需要在Follow and Crawl Only URLs字段中包含什么值?
google-search-appliance - Google Search Appliance - 过滤文件类型的最佳方式
我正在尝试按文件类型为用户设置过滤器。
使用特殊查询词文件类型过滤或文件扩展名过滤器将文本添加到查询词的末尾。依次显示 Searched for "abc etx:pdf" 并将其添加到几乎不理想的建议中。
为每种文件类型设置单独的前端或使用as_filetype也会导致类似的困境。
我真的不想为每个集合设置单独的集合,因为那样我最终会得到超过 70 个集合(我正在爬取 10 个站点)。
是否有任何其他替代方法可以按未添加到查询词的 mime 或扩展名过滤结果?按 mime 或扩展名过滤的最佳方法是什么?
google-search - GSA 对所有页面进行排序
谷歌搜索是否提供元数据排序选项。我有一个要求,建议对那里流行的内容进行排序并使用分页放置它们。我们正在将每个内容的下载/查看计数作为元数据推送到 GSA。
搜索结果中返回的所有结果都按下载/查看次数排序,这样第一页会显示最常用的内容,然后在接下来的页面中我们会开始看到不常用的内容。
google-search - 将 GSA 配置为仅抓取文件的元数据,而不是内容
在 GSA(Google Search Appliance)中,我正在研究如何让它只抓取元数据(名称、类型、大小、上次修改时间等)而不是文件的内容。虽然我意识到这会影响结果的有用性,但我有我的要求。
归结为文件的元数据是公开的,但文件的内容是受限制的。虽然这似乎是一个经过安全调整的问题,但它稍微多一点,因为我不希望 GSA 在索引中存储有关文件内容的任何信息。假设不信任 GSA 服务器来保存内容。这仅适用于整个数据集的一小部分。
关于如何将 GSA 和连接器配置为仅抓取元数据而不抓取内容的任何想法?
xml - 如何使用 XSLT 一次显示一个结果(例如包括 XML)
我正在为 Google Search Appliance 创建新的 XSLT,但遇到了一个我无法解决的问题。
我的 search.xml 具有以下结构:
我创建的 XSLT 如下所示:
我看到的问题是结果以以下方式呈现:
在浏览器中让它们看起来像这样:
戴夫·史密斯约翰·史密斯
职称高级职称
0000000000000001
谁能帮我解决这个问题?我感觉这是一个非常基本的 XSLT 错误,而且我并不是真正的 XSLT 专家。
非常感谢任何帮助。
谢谢
apache - Apache mod_rewrite 按状态码而不是 url
这应该是基本的,但是用谷歌搜索我找不到任何类似的例子。
我可以创建一个 Apache 重写规则,将所有 304 状态代码更改为 404,而不更改 url?我们的问题是,当我们的 Intranet 上未发布页面时,Aplaws CMS 会显示用户友好的“找不到页面”消息但返回 304,而我们的 Google Mini 框只会从返回 404 的搜索结果中删除 url。