问题标签 [relevance]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
805 浏览

solr - Solr - 分数总是 0

我是 Solr 的新手。我已经完成了网页的索引并获得了搜索结果。但是所有的结果都有

“得分” = 0 “提升” = 0

结果我的搜索结果没有正确排序。目前我的结果是根据网页的 url 按字典顺序排序的。我在查询中指定 fl=*,score。

我为索引网页的“内容”字段指定了以下参数

字段名称=“内容”类型=“文本”存储=“真”索引=“真”术语向量=“真”术语位置=“真”术语偏移=“真”省略标准=“假

请帮忙...

0 投票
2 回答
45 浏览

mysql - MySQL查询按1排序?

查询:

回报:

超级马里奥路易吉:内幕故事应该出现在超级马里奥和路易吉之前。我究竟做错了什么?

谢谢!

0 投票
1 回答
2276 浏览

nltk - 使用 NLTK 的命名实体识别。提取关键字的相关性

我正在检查 NLTK 的命名实体识别功能。是否可以找出提取的关键字与原文最相关?另外,是否可以知道提取的关键字的类型(个人/组织)?

0 投票
4 回答
675 浏览

php - 设计“基于相关性”的搜索?

在我的应用程序(PHP/MySQL/JS)中,我内置了一个搜索功能。其中一个搜索条件包含各种选项的复选框,因此,如果某些结果包含更多或更少的每个选项。

即选项是 A 和 B,如果我同时搜索选项 A 和 B,则仅包含选项 A 的结果 1 是 50% 相关的,而同时包含选项 A 和 B 的结果 2 是 100% 相关的。

之前,我只是根据表单输入进行简单的 SQL 查询,但这有点困难,因为它不像数据 LIKE "%query%" 那样简单,而是某些结果对某些搜索查询更有价值,有些不是。

我完全不知道从哪里开始……有人有相关的(哈!)阅读材料可以指导我吗?

编辑:在仔细考虑之后,我在想一些涉及 SQL 脚本来获取原始数据的东西,然后是很多轮解析是我必须做的事情......

但是,没有可缓存的东西吗?:(

0 投票
2 回答
770 浏览

sql - SQL 包含字符串中的表和关键字位置

对全文搜索有疑问。

我有一个有效的查询,但我想改进它。例如,假设我正在寻找“最佳解决方案”。在我的结果中(使用 FTS、CONTAINSTABLE、NEAR、ISABOUT、*)我有列rank、id、string

所以这个查询对我来说是 100% 正确的,所有RANKs 都是正确的,但我想让这个查询更相关。

如果关键字在字符串中的位置更靠左,则它应该出现在结果中的较早位置。例如:

这可能吗?如果是这样,我怎样才能得到这个结果?

0 投票
1 回答
2100 浏览

sql-server - 全文搜索:如何按相关性排序?

我正在使用全文搜索,在我的网站上,用户通常通过几个词、作者姓名(1-2 个词)和标题(1-3 个词)进行搜索...

我需要像相关性搜索这样的东西,并且已经尝试将包含表与 Rank 一起使用,但结果非常糟糕。

此外,我尝试将ISABOUT所有可能的组合与适当的权重一起使用 - 结果还可以,但速度很差。在 4 个单词内搜索大约 30K 行需要 10-20 秒。

我的查询是:

有任何想法吗?

0 投票
1 回答
217 浏览

c# - 相关百分比(搜索字符串在源字符串中更“左”)

任何人都可以帮助选择算法。

比较两个字符串并给出相关百分比(如果发现更多,则排名更高)。例如可能合并两种算法:寻找"chocolate white quills" 我们有记录

结果必须是这样的:

就像你可以看到它不是强比较必须使用我现在正在使用JaroWinkler ,现在结果是这样的

0 投票
2 回答
101 浏览

php - PHP & MySQL - 基于点击次数和时间的热门链接

目前,我正在按总点击次数对热门链接进行排序。但我也有每次访问的时间戳。如何不仅按总点击次数而且按时间对链接进行排序,以便仅在顶部显示最相关的链接?

0 投票
1 回答
435 浏览

algorithm - 相关性/匹配值树的算法

是否有我试图在下面描述的模式/算法的名称?...

假设您有一个相关数据树,如下所示:

  • IDE
    • 视觉工作室
      • 视觉工作室 2008
      • 视觉工作室 2010

然后我有一个对象,其中包含对“Visual Studio 2010”的引用。

然后我在这个对象上对“Visual Studio”进行相关性搜索,并想知道这个匹配的相关性。

在通过单独设置节点之间的特定值来构建树时,这是最好的做法吗?或者我可以/应该设置吗,例如,一层距离为 10 点,两层距离为 5 点,依此类推?

多个节点可能会链接到多个其他节点。或者这是一个坏主意?Visual Studio 也是一个“微软软件”等等。

这也可以做成两种方式吗?树上和树下都有点。

这是我测试和构建某种相关引擎的最初想法。请帮助我让我走上某种轨道。

0 投票
2 回答
1922 浏览

solr - Solr 在其随机字段值更改时更改文档的分数

我需要在按分数查看文档排序的 Solr 结果集中来回导航。为了形象化,首先将文档标题列表呈现给用户,然后他或她可以单击其中一个标题以查看更多详细信息,然后需要有机会移动到原始列表中的下一个文档而无需返回和单击另一个标题。

在查看文档期间更改:修改其动态字段(或创建尚不存在)以标记该文档已被查看(用于其他搜索)。

我面临的问题是,当文档被更改并重新索引以保留这些更改时,有时(但并非总是如此,这非常令人不安)它在相同查询的结果集中的位置会发生变化(换句话说,它的分数会发生变化因为在浏览按文档字段之一排序的结果时不会发生这种情况)。因此,“上一个”/“下一个”导航无法正常工作。

我没有在字段上使用任何自定义权重或助推器来计算分数。此外,在浏览期间更改的动态字段不参与用于浏览记录集的查询。

那么,问题是:对查询中未包含的文档字段的修改是否可以改变其相关性分数?如果可以,那我该如何控制呢?

更新

我做了一些测试,可以添加以下内容:

  1. 即使没有修改任何字段,文档也会更改其在结果集中的位置 - 只需请求文档并重新索引它而不对其字段进行任何更改,它就会在下次对同一索引执行相同查询时占据另一个位置。

  2. 即使结果集被显式排序(“first_name DESC”),也会发生这种情况,因此不涉及分数(取决于更新日期)。文档保持不变,其字段结果集排序依据相同,但其位置发生变化。

仍然不知道如何避免这种情况。