问题标签 [google-search-appliance]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
indexing - Nexus CMS - Google Search Appliance 索引
有人用这个CMS吗?我对此了解不多,需要索引一个使用 GSA(谷歌搜索设备)构建的网站,但在他们的网站上几乎没有关于它的文档。
想知道是否会有任何陷阱,它使用什么类型的数据库..
谢谢。
java - java中的GSA包装器?
有人知道 Google Search Appliance 的良好包装器实现吗?
google-search-appliance - Google Mini:访问缓存的抓取文件内容?
现在,我有一个 Google Mini 正在抓取一个目录,其中包含一堆各种格式的文档。有没有办法访问此目录中特定文档的缓存内容(如果它已被抓取/缓存)?
我正在寻找文件的纯文本,而不是抓取的文件本身。
file - 如何在 Google Search Appliance 上搜索多种文件类型
我想一次搜索多种文件类型。例如,当我想搜索“.htm”文件时,我将“filetype:htm”添加到查询中,效果很好。同样,“filetype:html”也可以。但是,如何指定返回所有 htm AND html 文件的查询参数?
google-search-appliance - 是否实时添加了 Google Search Appliance 供稿?
使用内容馈送将文档馈送到 Google Search Appliance 后多久可以在搜索结果中看到该文档?
google-search-appliance - 谷歌:禁用设备托管的搜索页面?
有没有办法禁用或密码保护托管在 Google Mini 设备上的搜索页面?我指的是选项 1 中描述的页面。
我基本上想防止有人偶然发现此 URL 并在此处搜索,而不是通过使用该设备的实际站点之一。
asp.net - 使用基本 HTTP 身份验证和 ASP.NET (VB) 对 Google Search Appliance 进行身份验证
我遇到了一个障碍,这与 Google Search Appliance 和 ASP 之间的身份验证有关。通常,当从 Search Appliance 请求安全页面时,Search Appliance 会请求凭据,然后使用这些凭据尝试访问安全结果。如果此尝试成功,该页面将显示在结果列表中。由于 ASP 代表客户与 Search Appliance 联系,因此它需要收集凭据并将其传递给 Search Appliance。我已经尝试了几种不同的记录方法来实现这一点,但它们似乎不起作用。以下是我尝试过的代码:
iframe - 如何使用 iFrame 获取 Google Mini 搜索结果,使其无法在 iFrame 中打开
我有一个使用 Google Mini 的 asp.net 站点。我在主页上有一个搜索框,它重定向到在 iFrame 中显示结果的搜索结果页面。这种方法全部取自 Google 为 Mini 提供的文档,看起来非常简单。
该文档未涵盖(或我找不到)的是单击任何可能是另一个 .aspx 页面的结果,打开该页面,其所有母版页都位于 iFrame 内,这显然是不希望的。我最终得到一个页面中的页面。
没有抓取 xml 搜索结果并自己进行操作,我如何才能让搜索结果链接像普通页面一样打开?
sitemap - 谷歌迷你忽略站点地图
我正在设置一个 Google Mini 设备来索引一个 ASP.Net 网站,该网站有很多动态生成的内容。我创建了一个动态的 site.map XML 文件,其中列出了所有的动态 URL。这符合XML 站点地图格式,目前正在被 Google 索引,但似乎被 Google mini 设备忽略。
我已将 site.map 文件添加到“从以下 URL 开始抓取”中。当我查看爬网诊断时,会出现 site.map 文件,但 site.map 中包含的动态 URL 都没有被编入索引。Google mini 设备仅索引 100 个 URL,而 site.map 包含 10,000 个。
如果我使用测试中心搜索短语,则搜索结果包括 site.map 而不是它指向的 URL。
有任何想法吗?
search - Google Mini 仅提供链接页面
我的 Google Mini 盒子里有一个奇怪的错误。设置尽可能简单。
- Google Mini 设置为抓取特定网站且仅抓取该网站。
- 我们只有默认的前端和默认集合
- 没有页面例外或排除
- 没有 https 或登录
- 所有 URL 和 IP 地址都是正确的。
Google Mini 可以正常抓取并编制索引,但是当我使用考试中心搜索时,我没有得到任何结果。
更新:
我可以看到并深入到单个页面抛出管理 gui,例如索引包含超过 4000 页。我能得到的唯一结果是当我搜索链接到另一个页面的特定页面时,如下所示:
有谁知道为什么会这样?