问题标签 [full-text-search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql-server - 您可以在 SQL Server 中使用哪些全文搜索工具?
除了全文索引和使用 LIKE 关键字之外,还有哪些其他工具可以在 MS SQL 之上构建搜索功能?这个问题特别适用于搜索记录,而不是文件。
windows - 如何实现进程内全文搜索引擎
在我们的一个商业应用程序(Win32,用 Delphi 编写)中,我们希望实现全文搜索。该应用程序以某种无法直接识别为文本的二进制格式存储用户数据。
理想情况下,我想找到一个进程内解决方案(DLL 可以)或我可以通过 TCP 访问的本地服务器(最好)。API 应该允许我向服务器提交文本信息(以及表示它来自的二进制 blob 的元数据),当然,它应该允许我进行全文搜索,至少对逻辑运算符的支持最少和子字符串搜索。需要 Unicode 支持。
我在 Stack Overflow 上找到了广泛的搜索引擎列表(有哪些搜索服务器?),但我并不真正了解哪些引擎可以满足我的需求。在我花一两天时间测试他们每个人之前,我想征求 The Collective 的意见。
有什么建议么?
sql-server - SQL Server 2005 全文索引阻止备份
每当我尝试备份数据库时,它会一直运行到 90% 并卡在那里,直到我手动杀死(因为如果我尝试停止它不会停止)msftesql 进程。
这显然意味着在全文索引和备份过程之间产生了冲突。
那么,你见过这样的事情吗?如果没有,您将如何调试此问题?
linux - 与自定义 Web 应用程序集成的最佳文本搜索引擎?
我们有一个网络应用程序,允许用户上传文档、创建自己的文档等等。上传的文件存储在 Amazon S3 上,创建的信息存储在 MySQL 数据库中。我正在寻找的是某种搜索引擎,我将所有的文本文档都提供给它,每个文档都有一个唯一的 ID,它会建立一个索引或其他什么。稍后,我可以给它搜索查询,它会提取出最匹配的文档(通过他们的 ID),以及匹配的文本片段。
基本上,我们希望允许我们的用户搜索他们上传的内容的存储库,以及其他用户标记为公开的任何内容。该解决方案应该在标准 Linux 服务器上运行,理想情况下它应该是开源的,但如果价格不高,我也会考虑付费解决方案。
到目前为止,我已经找到了三个潜在的候选人:
- MySQL全文搜索-我读过的一些报告是它非常慢
- Apache Lucene - 不幸的是用 Java 编写的,但如果必须,我会使用它。据说很快
- Sphinx - 似乎没有那么受欢迎,理想情况下,我找到的任何解决方案都会有很多社区支持。
请让我知道是否还有其他我忽略的好选择,或者您是否有上述任何方面的经验。
asp.net - ASP.NET 使用哪种搜索技术?
在网站上提供搜索工具的首选方法是什么?目前我更喜欢使用Lucene.net而不是索引服务/SQL Server 全文搜索(因为没有什么可以设置服务器端),但是还有哪些其他方法正在使用呢?
f# - F# 中的全文搜索引擎示例?
有没有关于如何在 F# 中构建全文搜索引擎的好例子(网站或书籍)?
sql-server - 无法使用高级服务查看 SQL Server 2008 中的全文目录
我在我的 Vista Home Premium 上使用带有高级服务的 SQL Server 2008。我在安装过程中安装了全文搜索,SQL 全文过滤器守护程序启动器正在通过管理员用户帐户运行。当我通过 SQL Server Management Studio 访问数据库时,在数据库下看不到“存储”选项,因此无法创建/编辑全文目录。
我能够通过 T-SQL 创建全文目录,并且可以对我在数据库中选择的列运行全文搜索。我只是看不到“存储”选项。
知道缺少什么吗?
perl - 如何从 Perl 对 PDF 文件进行全文搜索?
我有一堆 PDF 文件,我的 Perl 程序需要对它们进行全文搜索以返回哪些包含特定字符串。迄今为止,我一直在使用这个:
其中 $string 是要查找的文本。然而,这对于大多数 pdf 文件来说都失败了,因为文件格式显然不是 ASCII。
我能做什么最简单?
澄清:大约有 300 个 pdf 的名称我事先不知道。PDF::Core 可能是矫枉过正。我试图让 pdftotext 和 grep 相互配合,因为我不知道 pdf 的名称,我还找不到正确的语法。
使用 Adam Bellaire 的以下建议的最终解决方案:
mysql - PostgreSQL's and MySQL's full text search
How do the full text search systems of PostgreSQL and MySQL compare? Is any clearly better than the oder? In which way are they different?
sql - 有人可以给我一个关于 lucene.net 工作原理的概述吗?
我有一个 MS SQL 数据库,并且有一个varchar
我想做查询的字段,例如 where name like '%searchTerm%'
. 但是现在它太慢了,即使使用 SQL 企业的全文索引。
有人可以解释一下如何Lucene .Net
帮助我的情况吗?索引器如何工作?查询如何工作?
为我做了什么,我必须做什么?