问题标签 [phrase]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
172 浏览

match - 弹性搜索:如何获得一个词在短语中至少出现 x 次的结果?

我正在查询位置字符串。我的搜索工作方式是将位置作为逗号分隔的列表输入,我用逗号分割列表并为每个位置生成 location_raw 查询,如下所示:

但是,当我重复诸如“纽约,纽约”之类的术语时,这会导致问题。当该术语仅出现一次时,我会得到匹配项。这是生成的查询,我知道这显然行不通

但我不知道如何解决它。即使我只有一个“匹配”查询,我如何要求该术语至少出现 2 次?如果我搜索“纽约,纽约”,我只想获得至少包含两次“纽约”的 location_raw 字符串(如“纽约,纽约”或“纽约,纽约,纽约”),但不是“纽约皇后区”。

0 投票
2 回答
43 浏览

notepad++ - Notepad++ 删除行上重复的短语

我有一些数据发送给我,无论出于何种原因,发件人设法将数据并排复制了 3 次,如下所示:

我需要删除每个重复项,数据中只有 22,000 多行。有没有办法在 Notepad++ 中删除一行上的重复短语?

0 投票
1 回答
40 浏览

regex - 从 TAG 格式创建更复杂的正则表达式

所以我无法弄清楚我的正则表达式有什么问题。(包含对这些 TAG 格式的解释的原始对话可在此处找到:Translate from TAG format to Regex for Corpus)。

我从这样的字符串开始:

Arms_NNS 折叠_VVN ,_,

NNS也可以是NN,VVN也可以是VBG。我只想找到具有相同标签的其他字符串(NNS 或 NN 后跟 b VVN 或 VBG 后跟逗号)。

以下正则表达式是我正在尝试使用的,但它没有找到任何东西:

0 投票
0 回答
17 浏览

console - 我想从命令行中输入诸如“NAV”之类的单词并将其用作命令

我正在尝试创建一个基于文本的冒险游戏。它提示用户输入命令 NAV SHLD PHAS LRS SRS EXIT。

我可以轻松地制作与数字相关的命令并这样做,但这并不那么酷。我希望我的代码能够识别这些短语之一已在控制台中输入并从那里继续。

这就是我试图让代码工作的方式,不用说它没有。变量“command”被声明为 char“char command”;

谢谢你能给我的任何帮助我在这里遇到了很大的障碍:(

0 投票
1 回答
1683 浏览

python - 在 MySQL 中搜索短语关键字

我有一个表,它有两列:(ID主键,自动增量)和keyword(文本,全文索引)。在该keyword列中输入的值包括:关键字

  • 汽车销售
  • 汽车
  • 跑车
  • 运动足
  • 车吧
  • 统计数据

假设我们有这个句子作为输入:

我正在寻找(并且我已经搜索了很长时间)找到一个 MySQL 查询或一个接受给定输入的算法,并检测从keywords列中使用的关键字,从而产生以下输出:

换句话说,我试图以句子的形式输入,然后匹配数据库中在句子中找到的所有现有(和最相关的)关键字值。请注意,这些关键字可能是由空格分隔的单词组成的短语。

经过研究,我了解到 MySQL 通过其全文搜索功能做了类似的工作。我已经尝试了所有自然语言、布尔值和查询扩展选项,但它们包含的关键字记录只有一半的内容与输入匹配。例如,它输出:

我不希望这种情况发生,因为它包含甚至不在输入中的单词(即 foo 和 bar)。

这是上述搜索的 MySQL 查询:

我也试图提高相关性,但这个只返回一条记录:

0 投票
2 回答
4431 浏览

search - 弹性搜索精确词组匹配

我是 ES 新手。我无法找到完全匹配的词组。

假设我的索引有一个名为movie_name 的字段。假设我有 3 个具有以下值的文档

  1. 电影名 = 疯狂的麦克斯
  2. 电影名 = 疯狂的麦克斯
  3. 电影名 = 疯狂最大 3d

如果我的搜索查询是 Mad Max,我希望返回前 2 个文档,而不是第 3 个。

如果我执行“not_analyzed”解决方案,我将只得到文档 1 而不是 2。

我错过了什么?

0 投票
1 回答
100 浏览

java - Java将字符串转换为数字数组

我想知道是否有任何 java 函数可以从字符串中提取所有数字。字符串示例:

“Preostalo stanje u Zicer tarifi: 248 min i 0 sec, 497 SMS, 220 MB. Tarifa vrijedi do 01.06.2015." 我想提取 284 和 0、497 和 220 以及日期。

相同的函数应该提取其他类型的字符串,例如“Trenutacno imas 326 bonus MB koji ti vrijede do 02.06.2015”。它将在哪里提取 326 和日期。

像“Imas jos 42:39 od 50 minuta razgovora.Imas jos 81 od 150 poruka.Imas jos 118,0176MB.Nemas aktiviranu opciju 1000 bonbon minuta i SMS-ova :(”等字符串。

我认为我可以使函数遍历字符串,直到它找到数字字符然后它会对其进行表述,但这似乎很复杂。

0 投票
1 回答
390 浏览

solr - solr 中的多词停用词

如何在 stopwords.txt 文件中使用短语,例如“制作过程”、“准备方法”。我已经尝试过这里提到的解决方案,但无法成功。请指导我。

0 投票
1 回答
144 浏览

search - Lucene 短语查询和标记化索引

我在使用短语查询搜索 lucene 标记化索引时遇到了一个奇怪的问题。

我通过以下方式创建索引

我使用 WhitespaceAnalyzer 对值进行标记。如果我现在想搜索字符串“T-Test”,我会得到值 T-Test 1,T-Test 2, T-Test 3, T-Test

我通过以下方式创建查询。

我也尝试使用具有相同效果的 ComplexPhraseQueryParser。我只是得到所有的 T 检验值。但我只想要 T 测试而不是“T 测试 1、T 测试 2 和 T 测试 3”有人可以帮帮我吗?我快要绝望了 谢谢

0 投票
1 回答
491 浏览

text - 术语对和短语的 tm_term_score 错误

尝试使用 tm_term_score 为行中的文本将术语短语或术语对评分为 1 或 0 会得到此错误:

UseMethod(“tm_term_score”,x)中的错误:没有适用于“tm_term_score”的方法应用于类“c('VCorpus','Corpus')”的对象

str(terms) chr [1:61] “帮助学习”“帮助成长”。