问题标签 [fast-esp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
377 浏览

fast-esp - 从 FAST-ESP 中的 html 元数据中提取日期

在文档处理期间,我想从 html 元数据中提取所有日期,然后确定将用于填充日期字段 (dtgeneric1) 的最新日期。

使用 spy 阶段的检查表明我们的管道已经添加了 meta_* 属性,但元数据名称在来自不同来源的文档中会有所不同。

理想情况下,我们希望将所有 meta_* 属性传递给 Python 阶段,并使用它来计算出哪些是日期,哪些是最大的,但似乎没有办法将“所有元属性”指定为输入。

有没有人做过类似的事情,并且可以就最好的方法提供任何建议。

谢谢

尼尔

0 投票
2 回答
814 浏览

python - 快速 Esp 定制阶段开发

我正在研究企业搜索,我们正在使用 Fast ESP,现在我有 4 个项目,但我没有关于阶段和 python 的信息。但我意识到我已经学习了自定义舞台开发。因为我们在文件处理方面有很多困难。我想知道如何开发自定义阶段,尤其是我想知道如何找到 Attributefilter 阶段源代码。我在等你的答案

0 投票
2 回答
1865 浏览

sharepoint-2010 - FullTextSearchQuery 如何与 SharePoint 2010 和 FAST Search Server 一起使用?

我刚刚安装了一个使用 SharePoint 2010 和 FAST Search Server 作为默认搜索服务应用程序的测试环境。从一些测试内容开始,并使用标准执行了一些搜索。SharePoint GUI - 到目前为止一切都很好。

现在我想使用 Microsoft.Office.Server.Search.Query.FullTextSqlQuery 类执行一个更复杂的查询,事情变得很糟糕。当我尝试访问搜索返回的 ResultTableCollection 对象时出现异常。

这是我试图运行的 PowerShell 脚本:

这是一个例外(由上面的最后一行代码抛出):
给定的键不在字典中。
System.Collections.Generic.KeyNotFoundException at System.ThrowHelper.ThrowKeyNotFoundException() 在
System.Collections.Generic.Dictionary`2.get_Item(TKey key) 在
Microsoft.Office.Server.Search.Query.ResultTableCollection.get_Item(ResultType requestedType)

当我使用标准执行搜索时,相同的脚本可以完美运行。SharePoint 搜索服务应用程序。我在这里找到了一篇相关的帖子,指出查询结果的安全调整可能是我的问题的根源。但是,我看不出这在我的环境中应该如何相关,因为我的 FAST 服务应用程序的服务帐户肯定对 AD 具有足够的权限。

有什么建议么?

0 投票
1 回答
244 浏览

fast-esp - 如何从 FAST ESP 查询一次获得多个结果

我目前正在使用 java fast esp 接口(v5.0.15.1)来快速查询和检索结果。但是,我似乎只能从 IQueryResult 获得一个文档迭代器,并且每次调用 .next() 似乎都是一个 http 请求。有没有更好的方法来处理批量结果?

0 投票
1 回答
533 浏览

performance - 需要有关 Internet 站点的 FAST Search Server 2010 的信息

这不是 FAST Search for SharePoint 产品。我正在寻找有关无需 SharePoint 即可安装的 FAST 产品的信息。

我已经用谷歌搜索过,但除了以下博客之外找不到更多信息 - http://consultingblogs.emc.com/manjunathasubbarya/archive/2010/12/05/fsis-fast-search-for-internet-网站.aspx

我很好奇是否有中小企业支持安装和配置。微软网站上是否有任何信息?如果有人知道在 SharePoint 之外是否支持 FAST。

0 投票
0 回答
1496 浏览

sharepoint-2010 - 使用 FAST Search Server 和 SharePoint 2010 的多值托管属性

我的方案是安装了 FAST Search Server 的 SharePoint 2010 环境。我正在使用带有 FQL(快速查询语言)的 SharePoint KeywordQuery 类来针对 FAST 索引执行查询。

我的问题:显然快速搜索服务器“不支持返回的查询结果中的数据类型感知”(如此所述)。这意味着对于映射到多个爬网属性(例如“作者”)的托管属性,引擎将只返回一个包含所有值的字符串。(在这种情况下,SharePoint 搜索将返回一个字符串数组。)

我需要能够区分不同的值,因此我试图为该问题找到可能的解决方案。这是我到目前为止发现的:

  1. 实现自定义属性提取器并为不同的值引入分隔符。
  2. 修改例如 FAST 配置文件(例如 C:\FASTSearch\index-profiles\deployment-ready-index-profile.xml)并为不同的值引入分隔符。
  3. 使用 KeywordQuery 类 (ResultType.RefinementResults) 的精简功能并尝试精简结果和搜索结果之间的映射。

我认为 1 和 2 都不推荐,因为它们会改变“标准”托管属性的行为,这会对整个系统产生影响(例如,在 FAST Search Center 站点上)。此外,MS 似乎禁止了 2,因为配置文件将被任何 FAST 更新替换。3 似乎是一项非常昂贵的操作。

还有其他我错过的解决方案吗?任何建议都非常感谢...

0 投票
2 回答
2111 浏览

sharepoint - FAST Search Crawl 在本地文件系统上失败,错误为 0x80040d07

我已经在我的机器上成功安装了 Sharepoint 2010 和 FAST Search for Sharepoint 2010。抓取共享点站点似乎一切正常,但抓取本地文件系统一直失败,如下所示:

我从事件视图应用程序日志中得到了这个。我已确保将权限设置为允许对运行服务的用户进行读取、列出和执行访问。还尝试更新爬网规则等以使它们非常自由。

我在 Content Source 中尝试过的 URL 是://win-fs/C:/Users/ravish/FAST_TEST_SET file://win-fs/C:/Users/ravish/FAST_TEST_SET file:\win-fs\C:\用户\狂喜\FAST_TEST_SET

到目前为止似乎没有任何效果。一直在网上苦苦寻找答案,发现许多用户有类似的问题,但没有具体的直接回复。我已经花了几个小时,所以任何帮助将不胜感激。

我的系统详情:Windows Server 2008 R2 Sharepoint Enterprise 2010 FAST Search 2010

(全部安装在一台笔记本电脑上)

0 投票
1 回答
887 浏览

sharepoint-2010 - FAST For SharePoint Web Crawler 元标记提取

我正在使用 FAST For SharePoint 来抓取非 SharepPoint 网站。网站抓取没有错误,我可以得到任何关键字的结果。

我想通过 html 页面元标记在结果页面上创建细化器。必须有两级精炼机;类别和子类别。如果用户点击类别,精简面板必须显示所有相关的子类别。

元标记如下:

如何使用 FAST For SharePoint Webcrawler 提取抓取 html 页面的元标记?

我尝试将元标记名称添加到FAST Search Administration > Managed Properties并为这些元标记配置精简面板,但我无法获得结果。这没用。

谢谢!

0 投票
4 回答
1582 浏览

c# - 如何使用 .NET 有效地为 FAST ESP 提供千兆字节的数据

这将是一个棘手的问题,但无论如何我都会尝试:我们的任务是为 Microsoft FAST ESP 提供千兆字节的数据。最终的索引数据量在 50-60GB 左右。

FAST 有一个 .NET API,但核心组件是用 Python 编写的(处理管道以索引文档)。挑战在于可靠地与系统通信,同时为其提供千兆字节的数据以进行索引。

FAST 在这里出现的问题是:

  1. 当系统一次输入太多数据时,系统会变得古怪,因为它想要重新索引其数据,在此期间系统数小时内都无法访问。不可接受。

  2. 将所有数据排队并一次连续提供一个项目不是一种选择,因为这将花费太长时间(几天)。

  3. 当 FAST 无法索引某个项目时,客户端必须重新输入该项目。为此,系统应该调用一个回调方法来通知客户端失败。但是,每当系统超时时,馈送客户端都无法对超时做出反应,因为从未调用过该回调。因此,客户正在挨饿。数据在队列中,但无法传递给系统。队列崩溃。数据丢失。你明白了。

笔记:

  1. 喂食一件小件物品可能需要几秒钟,一件大件物品可能需要 5-8 小时。
  2. 被索引的项目是基于二进制和文本的。
  3. 目标是完整索引“仅”需要 48-72 小时,即它必须在周末进行。
  4. 这里的 FAST 文档处理管道(Python 代码)每个都有大约 30 个阶段。截至撰写本文时,共有 27 条管道。

总之:

主要的挑战是以适当的速度为系统提供大大小小的项目(不要太快,因为它可能会崩溃或遇到内存问题;不要太慢,因为这会花费太长时间),同时并行方式类似于异步运行的线程。在我看来,必须有一种算法来决定何时喂食什么物品以及一次喂食多少。我想到了并行编程。

也可能有多个“队列”,其中每个队列(进程)专用于特定大小的项目,这些项目被加载到队列中,然后一个接一个地馈送(在工作线程中)。

我很好奇是否有人做过这样的事情,或者你将如何解决这样的问题。

编辑:同样,我不打算“修复” FAST ESP 或改进其内部运作。挑战在于有效地使用它!

0 投票
1 回答
628 浏览

fast-esp - 用于查询可通过 http 访问的远程 FAST ESP 5.3 服务器的客户端工具

是否有可用于在可通过 http 访问的远程 FAST ESP 5.3 服务器上执行 FAST 查询的客户端工具?