问题标签 [content-based-retrieval]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
49 浏览

git - 如何将单个文件从一个 git 存储库添加到另一个?

是否可以将单个文件资源从一个 Git 存储库添加到另一个?

有点像子模块,但更轻量级

在 Internet 本身获得基于内容的内置寻址之前,我认为没有理由不在 Git 中提供这样的功能。

0 投票
1 回答
43 浏览

image-processing - Search for segment similarity inside strokes

i am looking for a technique or a known method to search a part of similar segments in a handwritten text.

its a kind of image retrieval, but rather than searching for an entire word or character, i want to search similar parts of strokes given a pattern as input image.

the figure below illustrate this process, where the red segments are input images and red rectangles represent part of text similar to the input.

enter image description here

by "similar", i mean "approximately", not exact matching

thanks in advance

0 投票
2 回答
753 浏览

machine-learning - Is it Item based or content based Collaborative filtering?

I am currently working on an existing system that recommends items that are similar to previous items that the user has liked.

It uses Alternating least squares Collaborative Filtering to find feature vectors of users and items. It then uses the feature vectors of the items and uses the cosine similarity measure to find similar items to it.

However, I would like some clarification as to whether this is item based CF or content based filtering? My inclination is that it is both. Since it is using a similarity measure to compare items, but the items are on the content of the feature vector?

Thanks,

0 投票
1 回答
1168 浏览

machine-learning - 推荐系统:是基于内容的过滤吗?

有人可以帮我澄清一下。

我目前正在使用协同过滤 (ALS),它返回一个推荐列表,其中包含与推荐项目相对应的分数。除此之外,如果项目包含与用户指定他们喜欢的标签(例如“浪漫电影”)相对应的标签,我会提高分数(+0.1)。对我来说,这被认为是一种混合协作方法,因为它通过基于内容的过滤来提升协作过滤结果(如果我错了,请纠正我)。

现在,如果我在不进行协作过滤的情况下采用相同的方法怎么办?它会被认为是基于内容的过滤吗?因为我仍然会根据用户指定他们喜欢的每道菜的内容和属性来推荐菜品(例如“浪漫电影”)。

我感到困惑的原因是因为我已经看到了基于内容的过滤,它们应用了诸如朴素贝叶斯等算法,这种方法类似于对项目的简单搜索(在内容上)。

0 投票
1 回答
256 浏览

recommendation-engine - 向员工推荐工作的推荐算法(众包平台)

我已经爬过 MTurk 网站。我有 260 个 Hits 作为数据集,并且从该数据集中,特定数量的用户选择了 Hits 并为每个选定的 Hits 分配了评级。现在我想根据他们的选择向这些用户推荐。怎么可能?谁能推荐我任何推荐算法?

0 投票
0 回答
306 浏览

elasticsearch - 使用 elasticsearch 进行基于内容的过滤

我正在尝试构建一个基于内容的过滤系统,该系统通过为产品分配类似 { salty: 0, sweet: 0.5, bitter: 0.7}. 这意味着我给每个产品一个 n 维向量,在这种情况下 [0, 0.5, 0.7]

对于给定的产品,我现在想通过计算向量之间的距离来找到“相似”的产品。所以对于两个产品[0.2, 0.2, 0.8][0.4, 0.9, 0.9]欧几里得距离大约是 0.78,这应该是他们的“分数”(越低越好)。

如何使用弹性搜索做到这一点?elasticsearch 是完成此类任务的正确工具吗?

请注意,真正的问题远不止 3 个维度。

0 投票
1 回答
237 浏览

image-processing - 如何测量Fisher Vector之间的距离以进行图像检索?

我读过一些关于 Fisher Vector 的文章,但我仍在学习过程中。它比经典的 BoF 表示更好,利用 GMM(或 k-means,即使通常称为 VLAD)。

但是,我看到它们通常用于分类问题,例如 SVM。

但是图像检索呢?我已经看到它们也被用于图像检索(here),但我不明白一点:给定两个 FV 代表 2 个图像,我们如何计算它们的距离以及“这两个图像有多相似?”

在这种情况下使用它们是否合理?

0 投票
0 回答
90 浏览

neural-network - 用于图像检索的近似最近邻中的神经网络描述符

Disclamer:我对神经网络或深度学习一无所知。

VLAD 和 Fisher Vectors with Product Quantization 是Approximate Nearest Neighbor如何用于良好图像检索的一个很好的例子。然而,已经证明神经网络方法比 Bag of Words 或 VLAD 更精确。

我的问题是:

  1. 创建 NN 描述符比经典方法(例如 VLAD 或 Fisher Vectors)更快?
  2. 我们可以使用带有 NN 代码的经典 ANN 方法来查找相似图像吗?如果不是,如何索引 NN 代码?
  3. 我们可以使用度量距离来测量 NN 代码之间的相似性吗?
0 投票
2 回答
1948 浏览

mean - 关于(平均)平均精度的困惑

这个问题中,我询问了有关精确召回曲线的说明。

特别是,我问我们是否必须考虑固定数量的排名来绘制曲线,或者我们可以合理地选择自己。根据答案,第二个是正确的。

但是现在我对平均精度 (AP) 值有很大的疑问:AP 用于在数值上估计我们的算法在给定特定查询的情况下有多好。平均平均精度 (MAP) 是多个查询的平均精度。

我的疑问是:如果 AP 根据我们检索到的对象数量而变化,那么我们可以调整此参数以发挥我们的优势,以便我们显示可能的最佳 AP 值。例如,假设 pr 曲线在 10 个元素之前表现出色,然后非常糟糕,我们可以“欺骗”仅考虑前 10 个元素来计算 (M)AP 值。

我知道这听起来可能令人困惑,但我在任何地方都没有找到任何关于此的内容。

0 投票
0 回答
201 浏览

matlab - 在MATLAB中查找两个矩阵之间的欧几里得距离

我正在为大学数据库制作基于内容的图像检索系统。我正在使用彩色特征来匹配图像之间的相似性。我的图像分辨率为 648 * 424 像素。基本上我正在做的是:

  1. 获取 8 * 8 px 图像块的彩色直方图,并将所有这些连接到一个矩阵中。为此,我使用了 MATLAB 函数 blockproc,代码如下所示:

    而函数 localHistogram 是:

    /li>
  2. 现在我想通过使用欧几里得距离比较特征向量 C 和 D 来找到两个图像之间的相似性。C和D的尺寸是2650 * 243。

以最大效率执行此操作的最佳方法是什么?