问题标签 [relevance]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
4794 浏览

mysql - 如何根据 MySQL 中的相关性将两个表的行相互映射?

我的数据库中有以下表格:(courses体育课的全部数据),coursedata(带有副本courses.titlecourses.description-FULLTEXT索引/相关性搜索所需),sports(体育列表)和courses_sports(关联表) - 见下文。

现在我想根据运动映射课程相关性并自动填充courses_sports这些数据。它需要两个步骤。

  1. 使用适当的SELECT.

  2. 将数据写入关联表。

这篇文章是关于第一步。我在编写查询时遇到了一些麻烦。我试过的:

此查询不起作用:

错误代码:1210

反对的论据不正确

如何正确实现此映射?


附加信息:相关表格

courses

coursedata

sports

courses_sports

0 投票
1 回答
739 浏览

mysql - MySQL 中 MATCH ('...' IN NATURAL LANGUAGE MODE) 的最大可能值范围是多少?

MySQL 提供FULLTEXT索引,可以使用MATCH (col1,col2,...) AGAINST (expr [search_modifier])构造检索。有多种全文搜索变体,其中之一(也是默认的)是Natural Language Full-Text Search

那么 MATCH 的最大可能值是多少(自然语言模式中的'...')?


例子:

这个查询

返回一个带有列的结果表relevance,我们在其中存储coursedata.title行的相关值'Basketball'。还是行的相关性'Basketball'coursedata.title?无论如何,我们将MATCH(...)函数的输出存储在那里。就我而言,我从0to 获取值3.695953130722046

0 投票
1 回答
465 浏览

algorithm - 如何计算两个单词或短语的相关性?

我需要一种算法来计算和测量两个单词或短语的相关性,例如“Apple”和“iPad”。

任何人都可以给我一些关于这些主题的提示或相关书籍吗?

谢谢。

0 投票
2 回答
79 浏览

relevance - 如何在会话相关性中插入双引号

那么如何使用会话相关性来获取记录呢?

包含 << 的 fixlet 名称"abcdef"123""不起作用。

顺便说一句,不要再尝试编辑了,这与 JAVA 无关

如果您不知道什么是会话相关性,请跳过此内容。

0 投票
1 回答
1582 浏览

solr - 仅返回与 Solr 匹配足够多的 NGram 的结果

为了使用 Solr 实现一定程度的容错,我已经开始使用NGramFilterFactory. 以下是来自的有趣位schema.xml

我正在使用EDisMax带有几乎库存配置的查询处理程序。以下是来自的有趣行solrconfig.xml

这很好用,但是给了我很多不相关的结果。使用 Solr 的分析功能,我认为我已经将问题归结为以下原因:

查询被分解为 NGram。然后 Solr 搜索字段中的标记化查询text或字段中的 NGram 之一text_ngram。搜索“某物”时,使用debug=query将打印出以下内容:parsedquery

如果我没看错,这意味着要么

  1. 其中一个 Ngram 需要匹配或
  2. 原始查询(标记化)需要匹配

现在这也会发现像“以太网”这样的项目,因为其中一个 NGram ( eth) 是相同的。

我的问题是:如何为 NGram 匹配设置更高的阈值?有没有办法说“仅在查询中至少 90% 的 NGram 匹配时才返回该项目”?确保 100% 的 NGram 匹配没有意义,因为这会有效地破坏容错。

我想到的另一种方法是仅返回相对于最高结果高于某个分数阈值的结果。这是因为与“ethernet”相比,“something”项目将具有非常高的相关性。那么有没有办法连接到 Solr 以仅返回具有例如的结果。至少是第一名的分数的 1/100?我读到有一种方法可以提供自定义HitCollector,但我真的找不到任何关于此的信息。

谢谢!

0 投票
3 回答
11062 浏览

wordpress - 按相关性对 Wordpress 搜索进行排序

我为我正在使用 atm 的 Wordpress 网站创建了一个非常高级的搜索。允许访问者按不同的分类法过滤结果,按日期或自定义字段以及正常的自由文本搜索(WP 默认提供)对它们进行排序。

我已经使用pre_get_posts过滤器完成了这项工作,只需将我的东西添加到查询中,如下所示:(请注意,我省略了一些健全性检查和其他代码)

现在我想添加另一种对帖子进行排序的方法,即按相关性。我知道这是一个非常常见的请求,我看到的大多数解决方案都包括使用 Relevanssi 插件。鉴于我已经编写了自己的“插件”(好吧,至少是代码)并设置了我所有的搜索表单和列表以使用它,此时切换到 Relevanssi 不会太容易。

Sooo,我想知道是否有人知道一些(最好)简单的方法来添加我已经拥有的代码?

据我了解,WP 使用LIKE代替进行搜索MATCH(),这就是为什么它甚至没有相关性分数可供排序。如果这是正确的,我假设我必须完全编写自己的查询?我怎样才能做到这一点而不会弄乱 WP 的分页等?或者我可以添加一些$qry->set('WHERE', "MATCH(post_content) AGAINST('$q' IN BOOLEAN MODE) AS relevance"); $qry->set('sortby', 'relevance')你认为的东西吗?

0 投票
0 回答
114 浏览

search - Twitter API 用户搜索的基本任务和结果的相关性

亲爱的 Stackoverflowianers,亲爱的 Twitter 专家,

这只是一个基本问题,等待一个简单的基本答案:

我使用以下 URL 通过 Twitter API 进行用户搜索:

结果如下所示:https ://snap.apigee.com/1awu22I

现在我的问题是:为什么 Twitter API 会找到名称为“John Solo”和屏幕名称为“Shock_Monster”的用户,或者例如名称为“Vicente Durán Casas”和屏幕名称为“vicdurcas”,甚至(最好的)“SWR Nachrichten RP”,屏幕名称为“swrnewsrp” ”。

在某些搜索结果中根本没有 Hans Spitzer... 为什么会发生这种情况或“如何对相关用户进行完美搜索”?

谢谢。提前为您解答!

最好的问候,英格玛

0 投票
3 回答
125 浏览

php - 如何在另一个字符串中间专门搜索一个字符串

在表的所有列中搜索子字符串。结果按以下顺序显示:
1.第一个结果以子字符串开头。
2.Then 结果是哪个子串在中间而不是最后
3.然后得出最后是哪个子字符串。在中间而不是最后
搜索子字符串时会出现问题,因为像 %substring% 也将包含实际上最后的 %substring 。因此不保留顺序。

0 投票
1 回答
317 浏览

sphinx - 狮身人面像:混合 revelance 和 age 进行排序

在我的索引中,我有 2 个文本字段:标题和内容,以及一个属性 date_publish。

我要订购

标题相关性、出版年龄、内容相关性

使用 Sphinx 2.0.2 和SphinxSE

怎么办?搜索模式 -> expr ? rank_mode -> expr ?

我迷路了..

其实我的想法是

bm25(@title)*1000+(1000/ (now()-date_publish)/86400) + bm25(@content)/10

(请注意,所有这一切仍处于不确定状态,我会根据您的评论和我的经验结果来完善我的问题;-)

0 投票
1 回答
311 浏览

sql - 通过在字符串中出现一组关键字来排序 sql 结果

对于每一行,我想获得每个描述与未定义数量的关键字的相关性。我知道“THEN +1”不起作用,但我想得到这个结果(......有一个数字(从每行 0 开始),每个关键字都会增加)

因此,如果描述包含“keyword1”和“keyword2”,则该行的相关性描述应为 2。