问题标签 [text-search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 获取包含特定字符串的所有数组条目,即彼此相邻,以及第一个之前的行
我有一个看起来像这样的 PHP数组:
我想抓取项目 6 到 9,然后将它们放入一个新数组中。
为此,我们需要这样做:请注意,我在可以有任何内容的地方使用星号,只要它与星号具有相同的字符数。我在可以有任何输入的地方使用主题标签,而不取决于字符数。
- 使用以下语法查找数组中的最后一个条目:
"****-**-** **:**:** [INFO] Showing # objective(s) on scoreboard"
- 使用此语法获取所有直接跟随的条目:
"****-**-** **:**:** [INFO] - #: displays as '#' and is type '#'"
- 将它们放入数组中
我真的基于这一点。我很确定正则表达式会派上用场,但我从来没有设法理解它们。
提前致谢
**编辑:**我完全忘记了一些非常重要的事情。请阅读此评论。
python - 在非索引文本文件中搜索单词的最快方法 - Python
考虑一个 150 万行的文本文件,每行大约 50-100 个单词。
要查找包含该单词的行,使用os.popen('grep -w word infile')
似乎比
否则如何在 python 的文本文件中搜索一个单词?搜索该大型未索引文本文件的最快方法是什么?
jena - 为现有的 Apache Jena TDB 创建 Lucene 索引以实现文本搜索
我有一个大型 Apache Jena TDB,我想使用 Apache Jena 2.10.2 构建一个 Lucene 索引,以用于新的文本搜索功能。我发现文档很难遵循。
我首先尝试在代码中使用配置,但遇到了依赖问题。lecene-core 和 solr-solrj 的任何组合都会导致某些“classNotFound”错误或“StandardAnalyzer overrides final method tokenStream”错误。代码示例:
我认为唯一的解决方案可能是创建一个文本数据集汇编器,但如果有人对在代码中创建它有建议,我更愿意这样做。
php - 搜索数字模式
我想从整个句子中搜索电话号码。在 PHP 的帮助下,它可以是具有 (122) 221-2172 或 122-221-2172 或 (122)-221-2172 等模式的任何数字,我不知道该数字存在于句子的哪个部分或我可以使用 substr。
java - Lucene 示例查询
当我按短语“ph1 ph2”搜索时,它会找到包含“ph1”或“ph2”的文本。
任何人都知道如何通过 1) 短语(“ph1 ph2”)进行搜索。示例:这是句子 ph1 ph2。2)具有最大距离的短语(“ph1 ph2 ~3”)。示例 这个 ph1 是句子 ph2。
PS 我使用标准的 Lucene Indexer 来索引我的文件。如果这个例子不清楚查看http://www.lucenetutorial.com/lucene-query-syntax.html
这是完整的代码:
oracle - Oracle 文本搜索中的一元 NOT 运算符
我正在尝试编写一个文本搜索查询,该查询将返回在一个部分中包含某个值且在另一部分中不包含某个值的记录。
像这样的东西:
此查询的语法不正确,因为 NOT 运算符需要两个操作数。我还尝试使用 % 作为第一个操作数:
它也不起作用。
有没有办法在文本搜索中实现我所需要的?
谢谢你。
mongodb - MongoDB 文本搜索逻辑 AND
MongoDB 似乎只做逻辑或文本查询?
如果我想查找包含单词('apple' or 'orange' or 'pear')的所有文档,我可以执行以下操作。
但是我如何找到所有包含所有三个单词('apple'、'orange'和'pear')的文档,没有特定的顺序。
这可能吗?
scrollbar - 在 Vb.net 的 Web 浏览器控件中搜索文本/短语
我正在使用 Web 浏览器控件在我的 Windows 应用程序中显示一些 HTML 文本。现在我想要一个可以在 HTML 文本中搜索文本或短语的功能。
那么任何人都可以帮助我找出如何做到这一点?如果控件上有滚动条,则表示文本太长并且搜索到的文本由于滚动条而无法显示,那么在搜索文本/短语之后,焦点应该放在搜索的文本/短语上,并且滚动应该相应地向下。
而且我也想在任何情况下搜索,例如如果用户选择单词“take”然后单击搜索,它将从控件中搜索确切的单词/短语。我不想要区分大小写的搜索。如果用户输入“take”,那么无论如何它都应该搜索“Take”或“TAKE”或“take”。所以我也不想要区分大小写的搜索。
请帮我解决问题。
提前致谢。
node.js - MongoDB/Node.js-mongoose-text-search 中的全文搜索
我正在尝试使用 mongoose-text-search 插件在 MongoDB 和 Node.js 上执行全文搜索。我正在关注来自https://github.com/aheckmann/mongoose-text-search的示例代码,我的代码如下所示。我不断收到一条错误消息:“错误:未启用文本搜索。未定义”我按照为 mongoose 安装插件的说明 - 出现错误,这导致我访问了 MongoDB 站点: http ://docs.mongodb.org/manual/教程/启用文本搜索。但是,在我通过键入命令启用文本搜索后:
mongod --setParameter textSearchEnabled=true
在终端中,我启动了我的应用程序并遇到了一个额外的错误。它指出:“MongoError:E11000 重复键错误索引:meddb.tweets.$id_1 dup 键:{:null} 这是错误:错误:未启用文本搜索未定义”
如果你们中的任何人遇到此错误并找到解决方法,请让我知道我缺少什么或需要更改。
grep - 从文本文件中搜索多个关键字,并格式化输出
我遇到以下问题:
假设我有一个要从多个文本文件中搜索的单词列表;例如在keywords.txt中,我有:
我想在许多其他文本文件中搜索每个单独的关键字。希望搜索的输出可以像这样格式化:
换句话说,我希望根据关键字对输出进行排序。
我使用 grep 取得了一点进展,但我不确定: 1)如何根据关键字对 grep 输出进行排序;2)如何输出整个句子,而不是只输出包含关键字的行(这是grep的默认行为)。
非常感谢任何建议。