“term”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

428 浏览

solr - solr：如何在分词器之后提升查询词

如果查询词是“ABCD”，那么被分词后就是“A”“BC”“D”。我想提升词“BC”，所以查询词是这样的：

用户输入的所有查询词都将被自动处理，以便提升重要的查询词。

我想我可以自定义一个新的 Tokenizer 来做，但我不知道它是否可行，或者有没有其他更简单的方法。

2012-09-29T06:32:25.660

0 投票

1 回答

63 浏览

emacs - 如何在 emacs-term 中禁用自动换行？

我正在使用 emacs 终端模拟器。带有 GNU bash 的 GNU Emacs 23.2.1，版本 3.00.0(1)-release。当某些命令，比如 grep 1 file.txt 打印很长的行时，emacs 将它们中继以适应窗口宽度。但是它对那些行做到了这一点，所以当我复制这样的行时，我得到的不是一条长线，而是几条等宽的线。

例如：

在回应它之后，说cat lorem.ipsum 我得到（如果我有一个 38 字符宽的终端）：

现在，如果我从终端复制它，我将有 4 行用 \n 字符分隔。很烦人，怎么处理？

emacs term

2012-10-05T12:04:51.407

0 投票

1 回答

402 浏览

emacs - 如何在 ansi-term 中使用 font-lock-add-keywords？

通过执行以下操作，我可以轻松地将要突出显示的关键字添加到lisp-interaction-mode：

一旦我（重新）在 lisp-interaction-mode 中打开任何缓冲区，这就会启动。

但是我不知道如何在 ansi-term 缓冲区中使用font-lock-add-keywords 。

我不知道我的模式是否错误，或者术语/ansi-term 缓冲区是否有一些“特殊”的东西会阻止上述工作。

我尝试使用“term-mode”，这显然是 ansi-term 正在使用的主要模式，但它似乎不起作用。

如何在ansi-term中使用font-lock-add-keywords？

emacs colors term

2012-10-06T15:56:33.180

0 投票

2 回答

1612 浏览

lucene.net - Lucene.net 查询包含并避免空字符串字段

我有一个 Lucene 索引设置，可以很好地查询。我只是无法让“字段不等于空字符串”条件起作用。例如在下面的代码示例中，我想要 3 个条件

其中“国家标签”字段包含“{4ED2F7EE-5C2A-418C-B2F6-236F94166BA1}”。
其中“国家标签”字段不是空字符串。
其中“日期”范围在“20110101T000000”和“20121001T000000”之间。
/li>

我有一种感觉我做错了，或者我的查询在某种程度上是错误的。我不应该需要一个我应该注意空字段或空字段的条件。

任何帮助表示赞赏！

lucene.net term

2012-11-07T16:15:48.340

0 投票

2 回答

6428 浏览

r - R DocumentTermMatrix 控制列表不起作用，默默地忽略未知参数

我有两个以下 DTM-s：

当我实现这个时，我看到两个相等的 DTM-s，如果我打开dtmImproved，会有带有 3 个符号的单词。为什么minWordLength参数不起作用？谢谢！

r matrix controls term tm

2012-11-13T18:54:41.060

0 投票

1 回答

399 浏览

java - 为什么要将Lucene的MoreLikeThis it's TermQueries限制在docFreq最高的字段？

我目前正在开发 Lucenes MoreLikeThis 的修改版本，以适应我自己的目的。有一件事我仍然无法理解。创建队列时，MoreLikeThis 会搜索该词条 docFreq 最高的字段。

该字段将在 TermQuery 中使用。这会产生奇怪的结果。

例如，假设您有两个字段，“title”和“body”，并且有两个具有完全相同标题的文档，但它们不会匹配，因为“title”中的所有单词在其他文档中出现的频率更高“身体”，反之亦然。这对我来说似乎很奇怪。

另一个例子：我在一个系统中使用它，该系统通过与用户相关的访问权限过滤结果，并且发生查询的用户无法看到导致所选字段的高 docFreq 的文档。生成的查询没有找到任何文档，尽管用户可以看到很多文档，其中包含确切的术语，只是在错误的字段中。

我想知道为什么他们不只使用所有字段，或者至少使用术语最初出现的字段。当然，这可能是性能问题。但我已经实现它以使用原始文档中出现该术语的所有字段，以及具有最高 docFreq 的字段。我在包含数千个文档的索引上对其进行了测试，但看不出有任何区别（但我没有做任何基准测试）。

那么，谁能告诉我为什么要这样实现？我能想到的唯一原因是在具有很多字段的非常大的索引上表现出色。

//编辑：我实现了第一个例子来澄清问题： http: //pastebin.com/fwdENb3F

java lucene information-retrieval term morelikethis

2012-11-21T18:49:27.200

0 投票

1 回答

9200 浏览

wordpress - 如何在wordpress中按自定义分类法对帖子进行排序？

我在 WordPress 中创建了名为“job_listing”的自定义帖子。

所有帖子都存储在“job_listing”下，对于工作，我们有工作类型的信息，例如。永久，兼职等

此 job_type 存储在术语中，我想按 job_type 搜索和排序所有工作/帖子。

任何人有解决方案？

wordpress term

2012-11-22T11:47:46.213

0 投票

3 回答

827 浏览

emacs - 根据 PWD 更新多项缓冲区名称

如果我使用 konsole 或其他终端，终端标签名称可以根据 PWD 更改。但在多术语中，缓冲区名称是*terminal<number>*. 这不是很好。因为当我在它们之间切换时，名称不是很丰富。所以我想根据 PWD 重命名它。

我发现Enter key绑定到 term-send-raw，所以我写了一个函数

但问题是pwd命令返回PWD终端缓冲区的，而不是该PWD终端中的SHELL。

PWD终端缓冲区的由设置defcustom multi-term-default-dir。并且它不会PWD在SHELL.

如何在终端中获取 SHELL 的 PWD？

问候。

emacs elisp term

2012-12-01T02:28:54.183

0 投票

2 回答

4568 浏览

solr - SOLR 词频

我正在使用 solr，到目前为止一切都很好。当我进行搜索时，我想返回搜索“词”在每个文档中出现的次数，以及文档本身。我找到了很多信息，但是经过它之后，我仍然不明白我该如何做到这一点。有那么难吗？

谁能帮我吗？

尽管我确实得到了结果，但 fl 字段始终为 0

solr frequency term

2012-12-03T17:22:05.240

0 投票

1 回答

329 浏览

apache - Solr/Lucene 结果字段术语计数

我正在使用 solr 进行搜索。结果我得到了一组字段。其中一个字段是“域”。域字段在我的数据库中是多对多关系，因此我的文档包含链接到的“域”数组。

我想要做的是，对于结果集中的每个域，计算在全局结果集中找到这个“域术语”的次数。

我该怎么做？

apache solr lucene term

2012-12-05T17:59:50.973

问题标签 [term]

Reference