问题标签 [term]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
428 浏览

solr - solr:如何在分词器之后提升查询词

如果查询词是“ABCD”,那么被分词后就是“A”“BC”“D”。我想提升词“BC”,所以查询词是这样的:

用户输入的所有查询词都将被自动处理,以便提升重要的查询词。

我想我可以自定义一个新的 Tokenizer 来做,但我不知道它是否可行,或者有没有其他更简单的方法。

0 投票
1 回答
63 浏览

emacs - 如何在 emacs-term 中禁用自动换行?

我正在使用 emacs 终端模拟器。带有 GNU bash 的 GNU Emacs 23.2.1,版本 3.00.0(1)-release。当某些命令,比如 grep 1 file.txt 打印很长的行时,emacs 将它们中继以适应窗口宽度。但是它对那些行做到了这一点,所以当我复制这样的行时,我得到的不是一条长线,而是几条等宽的线。

例如:

在回应它之后,说cat lorem.ipsum 我得到(如果我有一个 38 字符宽的终端):

现在,如果我从终端复制它,我将有 4 行用 \n 字符分隔。很烦人,怎么处理?

0 投票
1 回答
402 浏览

emacs - 如何在 ansi-term 中使用 font-lock-add-keywords?

通过执行以下操作,我可以轻松地将要突出显示的关键字添加到lisp-interaction-mode

一旦我(重新)在 lisp-interaction-mode 中打开任何缓冲区,这就会启动。

但是我不知道如何在 ansi-term 缓冲区中使用font-lock-add-keywords 。

我不知道我的模式是否错误,或者术语/ansi-term 缓冲区是否有一些“特殊”的东西会阻止上述工作。

我尝试使用“term-mode”,这显然是 ansi-term 正在使用的主要模式,但它似乎不起作用。

如何在ansi-term中使用font-lock-add-keywords

0 投票
2 回答
1612 浏览

lucene.net - Lucene.net 查询包含并避免空字符串字段

我有一个 Lucene 索引设置,可以很好地查询。我只是无法让“字段不等于空字符串”条件起作用。例如在下面的代码示例中,我想要 3 个条件

  1. 其中“国家标签”字段包含“{4ED2F7EE-5C2A-418C-B2F6-236F94166BA1}”。
  2. 其中“国家标签”字段不是空字符串。
  3. 其中“日期”范围在“20110101T000000”和“20121001T000000”之间。

    /li>

我有一种感觉我做错了,或者我的查询在某种程度上是错误的。我不应该需要一个我应该注意空字段或空字段的条件。

任何帮助表示赞赏!

0 投票
2 回答
6428 浏览

r - R DocumentTermMatrix 控制列表不起作用,默默地忽略未知参数

我有两个以下 DTM-s:

当我实现这个时,我看到两个相等的 DTM-s,如果我打开dtmImproved,会有带有 3 个符号的单词。为什么minWordLength参数不起作用?谢谢!

0 投票
1 回答
399 浏览

java - 为什么要将Lucene的MoreLikeThis it's TermQueries限制在docFreq最高的字段?

我目前正在开发 Lucenes MoreLikeThis 的修改版本,以适应我自己的目的。有一件事我仍然无法理解。创建队列时,MoreLikeThis 会搜索该词条 docFreq 最高的字段。

该字段将在 TermQuery 中使用。这会产生奇怪的结果。

例如,假设您有两个字段,“title”和“body”,并且有两个具有完全相同标题的文档,但它们不会匹配,因为“title”中的所有单词在其他文档中出现的频率更高“身体”,反之亦然。这对我来说似乎很奇怪。

另一个例子:我在一个系统中使用它,该系统通过与用户相关的访问权限过滤结果,并且发生查询的用户无法看到导致所选字段的高 docFreq 的文档。生成的查询没有找到任何文档,尽管用户可以看到很多文档,其中包含确切的术语,只是在错误的字段中。

我想知道为什么他们不只使用所有字段,或者至少使用术语最初出现的字段。当然,这可能是性能问题。但我已经实现它以使用原始文档中出现该术语的所有字段,以及具有最高 docFreq 的字段。我在包含数千个文档的索引上对其进行了测试,但看不出有任何区别(但我没有做任何基准测试)。

那么,谁能告诉我为什么要这样实现?我能想到的唯一原因是在具有很多字段的非常大的索引上表现出色。

//编辑:我实现了第一个例子来澄清问题: http: //pastebin.com/fwdENb3F

0 投票
1 回答
9200 浏览

wordpress - 如何在wordpress中按自定义分类法对帖子进行排序?

我在 WordPress 中创建了名为“job_listing”的自定义帖子。

所有帖子都存储在“job_listing”下,对于工作,我们有工作类型的信息,例如。永久,兼职等

此 job_type 存储在术语中,我想按 job_type 搜索和排序所有工作/帖子。

任何人有解决方案?

0 投票
3 回答
827 浏览

emacs - 根据 PWD 更新多项缓冲区名称

如果我使用 konsole 或其他终端,终端标签名称可以根据 PWD 更改。但在多术语中,缓冲区名称是*terminal<number>*. 这不是很好。因为当我在它们之间切换时,名称不是很丰富。所以我想根据 PWD 重命名它。

我发现Enter key绑定到 term-send-raw,所以我写了一个函数

但问题是pwd命令返回PWD终端缓冲区的,而不是该PWD终端中的SHELL

PWD终端缓冲区的 由设置defcustom multi-term-default-dir。并且它不会PWDSHELL.

如何在终端中获取 SHELL 的 PWD?

问候。

0 投票
2 回答
4568 浏览

solr - SOLR 词频

我正在使用 solr,到目前为止一切都很好。当我进行搜索时,我想返回搜索“词”在每个文档中出现的次数,以及文档本身。我找到了很多信息,但是经过它之后,我仍然不明白我该如何做到这一点。有那么难吗?

谁能帮我吗?

尽管我确实得到了结果,但 fl 字段始终为 0

0 投票
1 回答
329 浏览

apache - Solr/Lucene 结果字段术语计数

我正在使用 solr 进行搜索。结果我得到了一组字段。其中一个字段是“域”。域字段在我的数据库中是多对多关系,因此我的文档包含链接到的“域”数组。

我想要做的是,对于结果集中的每个域,计算在全局结果集中找到这个“域术语”的次数。

我该怎么做?