问题标签 [approximate]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
424 浏览

python - 比较列表相似度 Python

我想获得输出以显示相似性

我怎么能做到这一点?我想使用近似匹配将“hom”更改为“home”。

0 投票
1 回答
400 浏览

android - Android开发,如何获取近似坐标?

好的,所以我在surfaceView 上制作了一个简单的应用程序,其中我有一个从屏幕顶部到底部的球的位图。一旦它到达底部,它就会再次出现在顶部,然后又开始回落。

接下来我试着让它在我点击球落下时回到屏幕顶部。但是,我遇到了问题,因为我无法单击它(因为我认为它只有一个像素)。我将 onTouchListener 设置为单击的坐标getX()getY()坐标,如果单击的 x 和 y 坐标等于球当前位置的 x 和 y,则球会回到屏幕顶部。

这虽然行不​​通。因为为了让我能够点击球,我必须点击当时球所在的确切中心像素。所以我的问题是我该怎么说:如果点击接近或大约等于球的当前位置,那么回到顶部。我是一个菜鸟,所以如果我问愚蠢的问题,我道歉,我正在努力学习。非常感谢您的帮助。我很感激。

0 投票
1 回答
400 浏览

c++ - 使用“近似”STL 映射

我想创建一个 STL 映射来查找一个项目是否足够接近 3 维空间中的另一个项目。到目前为止,我的“小于函子”运行良好,粘贴到以下链接。

现在这个问题还不是“最近邻”问题。相反,这是一个“在一定距离内是否有邻居”的问题。

我的示例仅显示一个维度。为了清楚起见,我跳过了 Y/Z 尺寸。

到目前为止我的尝试

在极少数情况下,我的意思是——非常罕见——当位置重叠时,地图找不到匹配的条目。

仍然使用 STL 容器,我可以做些什么来更好地实现这一点?

0 投票
3 回答
2622 浏览

c# - 比较与自适应近似相等的双打

我正在尝试制作一个自适应的“大约相等”方法(用 C# 编写,但问题很笼统)接受两个双精度数并返回一个布尔值,如果它们“大约相等”或不“大约相等”。通过自适应,我的意思是:

1.234 和 1.235 ==> 真

1.234567 和 1.234599 ==> 错误

也就是说,“大约相等”的精度适应数字的精度。

我在如何找到两个变量是否近似相等?但是对于 epsilon 使用什么仍然存在开放式问题。

有人知道此类问题的最佳实践吗?提前致谢!

编辑:我最初的问题没有包含足够的信息来说明我想要得到什么。很抱歉,我很抱歉。我想要一个程序,它可以将更高的精度数字处理为更高的标准,同时对更低的精度数字更宽容。对的更多示例是(其中 '(0)' 是隐含的零):

1.077 和 1.07(0) 返回 false(因为 77 与 70 非常不同)

1.000077 和 1.00007(0) 返回 false(因为 77 与 70 非常不同)

1.071 和 1.07(0) 返回 true(因为 71 接近 70

1.000071 和 1.00007(0) 返回 true(因为 71 接近 70)

无论实现代码如何,我都假设会有某种“公差”变量来确定什么是“非常不同”和什么是“接近”。

0 投票
2 回答
4468 浏览

opencv - OpenCV - 在偏移处绘制轮廓

我正在使用 OpenCV 进行图像处理。我正在寻找一个人体,我想隔离(段)。

目前,我能够找到身体的轮廓,并用多边形近似轮廓。接下来,我想在 cvWatershed 中使用该轮廓,以真正隔离身体。

有谁知道我如何在向中心偏移处绘制轮廓?为了说明,请参见下图。

在此处输入图像描述

蓝色:轮廓的多边形近似

红色:我想要的多边形,但找不到。(在上图中,我使用了 Photoshop...)

这是我查找和绘制当前轮廓的方法:

编辑:根据以下答案,我找到了两种解决方案:

0 投票
0 回答
85 浏览

recursion - RSpec 是否支持递归近似匹配?

在 RSpec 我可以做这样的事情:

有没有一种内置的方法可以使这个递归近似?例如:

如果没有内置的方法,我意识到我可以(并且将)自己写这个。

0 投票
0 回答
351 浏览

algorithm - 蜂巢中top-k查询的近似算法?

每个人,在蜂巢中,我们使用

用于前 N 个查询。
由于我们知道速度并不快,所以我学习了一些用于top-k查询的近似算法,例如countsketch算法或其他算法。
我们可以在 hive 中添加近似算法以加快 top-k 查询吗?

0 投票
3 回答
339 浏览

r - 从 R 中文本字符串的第一个近似匹配中提取信息(并对匹配的总数求和)

我无法对文本字符串的近似匹配求和,以及从第一次匹配的字符串中提取信息。

我有看起来像这样的数据:

请注意,最新的文本字符串在较早的文本字符串中添加了全大写“THEN”和“AT”。

我想要一个看起来像这样的表:

这包括:

与最早日期的文本对应的ID号(其他文本源自的“原始”文本)。 每个的所有近似匹配的总和。与最早日期对应的文本。并且文本的日期与最早的日期相对应。

我有数千万个案例,所以我在自动化流程时遇到了麻烦。

我运行 Windows 7,并且可以访问快速计算服务器。

想法

从这里,我可以使用“agrep”,但我不确定在什么情况下。任何帮助将不胜感激!

注意:虽然下面的三个答案确实以我最初提出的方式回答了我的问题,但我没有提到即使没有“AT”和“THEN”这两个词,我的文本案例也会有所不同。事实上,它们中的大多数并不完全匹配。我应该把它放在原来的问题中。但是,我仍然希望得到一个答案。

谢谢!

0 投票
2 回答
13796 浏览

string - Excel 近似文本匹配

我正在尝试检查 A 列中有多少字符串与 B 列中的字符串大致匹配。

例子:

如果我在 B 列中有字符串“angry_birds_iph_app”,并且“angry_birds_iph_app”和“angry_birds_adrd_app”出现在 A 列的某处,我希望函数返回 2。

0 投票
2 回答
423 浏览

c++ - 近似字符串匹配的概率预选

我最近的任务是开发一种算法来检查数据库中的重复客户记录。DB 布局非常简单:数以万计的行,包含 FullName、Street、City、ZIP、Phone 等字段。

先说一点背景:

我对算法进行了一些广泛的研究,并决定每个领域都应该使用不同的算法进行一定程度的权衡,因为并非所有领域在所有情况下都表现得一样好。例如,姓氏的权重因子为 0.50。当我评估时,我会选择要使用的算法以及它们对最终决定的影响:
因子 0.25:JaroWinkler
因子 0.60:余弦 2-Gram 相似
因子 0.15:DamerauLevenshtein

一切运行良好,稍加调整后,我检测到的积极因素几乎没有错误。到现在为止还挺好。但是,正如您可以想象的那样,在处理数万条记录时,运行时间为 O(n^2) - 或者实际上是 E 从 i=0 到 i=n - 并不是很有效。不用说,积极优化,使用编译器优化速度,多线程等,只是创可贴,因为真正的问题是复杂性。

本质上,我正在寻找一种预先过滤潜在匹配的方法,并且现在已经对此进行了三天的研究。我发现了一些关于 R-Trees、R*-Trees、KD-Trees、欧几里德向量、minhashing 等的有价值的信息。然而,关于所有这些的大多数信息都是相当学术性的。我发现的最有价值的资源是“挖掘海量数据集”,第 3 章。

现在到我真正的问题:

我已经阅读了所有这些信息,但我不确定如何将它们放在一起。

我正在考虑在树或图形数据结构中进行某种索引,我可以在其中输入一个字符串并说“找到所有匹配概率> 0.20的人”。这个算法应该非常快。然后,当我得到一个潜在的(>0.20)匹配列表时,我可以去比较几个项目和我的“昂贵”但有选择性的算法。我认为这应该将运行时间减少到一个非常合理的值。

我一直在尝试找到某种参考代码来做我想做的上面的事情,但除了学术文章之外,我似乎没有想出任何东西。我确实找到了实际编译的“simstring”,但似乎与 7 条测试记录不太匹配。有人能指出我正确的方向吗?肯定有人以前遇到过这个问题并找到了解决方案......

非常感谢您!

PS 我在 C++ 中执行此操作,但 C#/C/Java/PHP 中的任何示例都可以。