问题标签 [search]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
9889 浏览

java - 使用 Lucene 统计分类结果

我正在尝试使用 Lucene Java 2.3.2 来实现对产品目录的搜索。除了产品的常规字段外,还有一个名为“类别”的字段。一个产品可以属于多个类别。目前,我使用 FilteredQuery 为每个类别搜索相同的搜索词,以获取每个类别的结果数。

这会导致每个查询进行 20-30 次内部搜索调用以显示结果。这大大减慢了搜索速度。有没有更快的方法使用 Lucene 实现相同的结果?

0 投票
6 回答
16575 浏览

php - 用 PHP 搜索 MySQL 数据库的最佳方法是什么?

假设我在 MySQL 数据库中有一个书籍表,并且我想在“标题”字段中搜索关键字(由用户在搜索字段中输入);在 PHP 中执行此操作的最佳方法是什么?MySQLLIKE命令是最有效的搜索方式吗?

0 投票
2 回答
3214 浏览

c# - 在 C# 的另一个进程内存中搜索特定字符串(或字节数组)的快速方法?

请发布一个工作源代码示例(或链接),说明如何在另一个进程内存中搜索字符串并在找到时获取匹配偏移量。类似的方式在游戏作弊工具中使用 ReadProcessMemory 搜索游戏内存中的值。

0 投票
3 回答
2309 浏览

search - 单数/复数搜索和词干提取

我正在为单复数关键字搜索找到一个简单的解决方案。我听说过词干提取,但我不想使用它的所有功能,只有复数/单数转换。语言是荷兰语。以前看过http://www.snowball.tartarus.org。有谁知道单数|复数相关搜索的简单解决方案?提前致谢。

0 投票
2 回答
2113 浏览

c# - 使用复杂模式在目录中搜索文件

我正在寻找一个 C# 库,用于使用类似于 Ant 中使用的复杂模式从目录中获取文件或目录:

  • dir1/dir2/**/SVN/*--> 匹配 SVN 目录中位于目录树 dir1/dir2 下任意位置的所有文件
  • **/test/**--> 匹配路径中包含 test 元素的所有文件,包括 test 作为文件名。
  • ...

我需要自己编码吗?从 NAnt 中提取我想要的东西?或者这个图书馆存在,我的谷歌技能很烂。

Directory.GetFiles(String path, String searchPattern)不处理目录模式和NDepend.Helpers.FileDirectoryPath(顺便说一句,它是一个很棒的路径操作库)

0 投票
6 回答
3363 浏览

algorithm - 对日志进行快速文本搜索

这是我遇到的问题,我有一组可以很快增长的日志。它们每天都被拆分成单独的文件,并且这些文件可以很容易地增长到一个演出的大小。为了帮助缩小规模,超过 30 天左右的条目将被清除。

问题是当我想在这些文件中搜索某个字符串时。现在,Boyer-Moore 搜索速度慢得令人难以置信。我知道像 dtSearch 这样的应用程序可以使用索引提供非常快速的搜索,但我不确定如何在不占用日志已经占用两倍空间的情况下实现它。

有什么我可以查看的资源可以提供帮助吗?我真的在寻找一种标准算法,它可以解释我应该做什么来构建索引并使用它来搜索。

编辑:
Grep 不起作用,因为此搜索需要集成到跨平台应用程序中。我无法将任何外部程序加入其中。

它的工作方式是有一个带有日志浏览器的 Web 前端。这与自定义 C++ Web 服务器后端对话。该服务器需要在合理的时间内搜索日志。目前搜索几场日志需要很长时间。

编辑 2:其中一些建议很棒,但我必须重申,我不能集成另一个应用程序,它是合同的一部分。但为了回答一些问题,日志中的数据与接收到的医疗保健特定格式的消息或与这些相关的消息不同。我希望依赖索引,因为虽然重建索引可能需要一分钟,但目前搜索需要很长时间(我已经看到它最多需要 2.5 分钟)。此外,很多数据在记录之前就被丢弃了。除非打开某些调试日志记录选项,否则会忽略一半以上的日志消息。

搜索基本上是这样的:Web 表单上的用户会看到最新消息的列表(当他们滚动时从磁盘流式传输,是的 ajax),通常,他们会想要搜索包含一些信息的消息它,可能是患者 ID,或者他们发送的一些字符串,因此他们可以将字符串输入到搜索中。搜索被异步发送,自定义 Web 服务器一次线性搜索 1MB 的日志以获取某些结果。当日志变大时,此过程可能需要很长时间。这就是我要优化的。

0 投票
2 回答
2140 浏览

sharepoint - 在 Sharepoint 中搜索日期元标记

我目前正在考虑从 Sharepoint 索引一个 ASP 网站,我需要复制用户熟悉的旧“高级搜索”模式。为了做到这一点,我需要从网页中索引一些元标记。这很容易完成,对于文本字段,我也可以在搜索中使用它们。但是对于日期元标记,例如“过期”或“已发布”,我遇到了一些问题。问题基本上是元标记被抓取为“文本”,但我需要 Sharepoint 将它们解析为日期时间。我在TechNet上看到过一些帖子要求相同,但没有答案。

1https ://forums.microsoft.com/TechNet/ShowPost.aspx?PostID=2614064&SiteID=17 TechNet

0 投票
4 回答
1718 浏览

vb.net - .NET - 查找属性分配的所有引用

我正在使用 VB.NET。在 Visual Studio 中,如果我右键单击属性名称并单击“查找所有引用”,它会搜索正在使用的属性的所有实例。

但是,属性始终用于赋值(Set 方法)或检索(Get 方法)。有什么方法可以只搜索其中一种用途吗?例如,在代码中搜索该属性的所有用途,其中它被分配了一个值,而不是在检索该值时。

0 投票
3 回答
1522 浏览

search - 你能推荐一个非结构化数据索引软件吗?

我正在从几个定制的应用程序中收集日志。每个应用程序都有自己的日志格式。我正在寻找的是一个中心工具,它可以让我搜索我的所有日​​志。这意味着该工具必须能够为每个日志文件定义不同的正则表达式(或类似的)(标记记录的开始位置、结束位置以及字段是什么)。我一直在尝试 Splunk,但我对此并不满意,因为性能很慢,我每天的索引数据量有限(免费版),而且它不像我想要的那样灵活. 你能为这项任务推荐一个软件(最好是免费的或便宜的)吗?

0 投票
12 回答
318464 浏览

javascript - 不区分大小写的搜索

我正在尝试在 JavaScript 中使用两个字符串进行不区分大小写的搜索。

通常它会是这样的:

/i标志将用于不区分大小写。

但我需要搜索第二个字符串;没有标志,它可以完美运行:

如果我将/i标志添加到上面的示例中,它将搜索 searchstring 而不是变量“searchstring”中的内容(下一个示例不起作用):

我怎样才能做到这一点?