问题标签 [full-text-indexing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
search - 如何设置 Solr 以标记空格和标点符号?
我一直试图让我的 Solr 模式(使用 Solr 1.3.0)来创建由空格和标点符号化的术语。以下是我希望看到的一些示例:
我认为这种组合会起作用:
问题是这会导致以下字母到数字的转换:
我尝试了各种WordDelimiterFilterFactory
设置组合,但没有一个被证明是有用的。是否有可以处理我需要的过滤器或标记器?
java - 使用同一个索引文件和 Hibernate Search 的两个应用程序
我想知道是否可以在两个应用程序中为实体使用相同的索引文件。让我更具体一点:
我们有一个用于用户前端的在线应用程序和一个用于后端任务的应用程序(= 管理员界面)。两者都在同一个 JBOSS AS 上运行。两个应用程序都使用相同的数据库,因此它们使用相同的实体。当然,实体的两个应用程序中的包名称并不相同。
所以这是我们的用例:用户应该能够通过 frondend 进行搜索。用户只能查看带有“可见”标签的结果。此标记发生在我们的管理界面中,因此每次在后端将实体标记为“可见”时,都应更新前端的索引。
当然,这两个应用程序确实具有相同的索引根文件夹。在我的索引文件夹中有 2 个索引文件:
de.xxadmin.model.Product de.xxfrondend.model.Product
如何通过休眠搜索配置“合并”这个?我只是没有通过文档得到它......
谢谢你的帮助!
postgresql - 无法从 postgre 全文搜索中获得正确的结果
我正在开发一个简单的巴西葡萄牙语文章网站。搜索功能基于全文搜索,但未返回预期结果。
我在 postgresql 上做了这个。这是简化表:
创建表后,我运行:
是的,我打算对搜索使用简单的加权。做了一个索引来加速,一个触发器,所以我可以插入和更新,而不用担心重新制作索引等等。
好吧,根据我的理解,一切都很好。但结果并非如此。一个简单的例子。
假设我有“... banco de dados ... no banco ...”作为一篇文章内容。当我做:
它返回一个空集。我检查了 ts_vector 列并看到了谓词“banc”和“dad”。但我仍然不明白为什么它不返回包含所提到文章的行。
有人可以为这个问题带来启示吗?
mysql - MySQL全文索引消耗多少额外的存储空间?
我正在寻找一种方法来估计如果 MySQL TEXT 列获得全文索引将需要多少额外存储空间。
直观地说,全文索引的大小取决于文本的总长度,但究竟是什么影响了它呢?
asp.net - 如何索引一个网站
我是代表某人问的,所以我没有太多细节。
哪些选项可用于索引 ASP.NET 网站中的网站内容?如果页面内容存储在数据库中,我怀疑可能会使用 SQL Server 的全文索引。如果动态和静态内容不存储在数据库中,而是存储在 html 和 aspx 页面本身中,我将如何索引该内容?
python - 我应该如何在 App Engine 上进行全文搜索?
我应该怎么做才能在 App Engine 上以尽可能少的工作进行快速的全文搜索(以及尽可能少的 Java — 我正在使用 Python。)?
sql - 从全文索引中排除文件类型
我在 varbinary(max) 文件流列上创建了全文索引。我将 PDF 和 XML 都存储在这个文件流中,因此它们都被索引了。但是,我真的不想索引 XML 文件,因为我担心随着时间的推移它们会膨胀我的索引并减慢它的速度。所以我真正想做的只是在 PDF 文件上有我的全文索引。有没有办法做到这一点?也许我可以以某种方式禁用 XML 过滤器吗?
sql-server - 在 Windows Server 2008 上运行的 SQL Server 2000 全文索引
我在 Windows Server 2008 上运行 SQL Server 2000 SP4,我正在尝试创建一个全文目录,其中包括几个表上的全文索引。该目录的项目计数为 53676,但唯一键计数仅为 8。
在具有完全相同数据的另一个数据库(Windows Server 2003 机器)上,我设置了完全相同的全文目录,并且唯一键计数为 75312。
是什么导致唯一键计数如此之低?
sql-server-2008 - Sql Server 2008 中缺少全文索引系统视图
我一直在阅读有关系统视图的信息:sys.dm_fts_index_keywords_by_document
在 msdn 上,但在我的 2008 数据库中找不到该视图。任何人都知道它是否应该默认存在?
indexing - 是否可以在 lucene 中使用负查询提升?
我想惩罚查询中的一些术语,而不是根本不忽略它们,所以“MUST NOT”运算符不起作用?是否可以在 lucene 的布尔查询中使用 SHOULD 的负查询提升,它是如何工作的?