问题标签 [approximate]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 比较列表相似度 Python
我想获得输出以显示相似性
和
我怎么能做到这一点?我想使用近似匹配将“hom”更改为“home”。
android - Android开发,如何获取近似坐标?
好的,所以我在surfaceView 上制作了一个简单的应用程序,其中我有一个从屏幕顶部到底部的球的位图。一旦它到达底部,它就会再次出现在顶部,然后又开始回落。
接下来我试着让它在我点击球落下时回到屏幕顶部。但是,我遇到了问题,因为我无法单击它(因为我认为它只有一个像素)。我将 onTouchListener 设置为单击的坐标getX()
和getY()
坐标,如果单击的 x 和 y 坐标等于球当前位置的 x 和 y,则球会回到屏幕顶部。
这虽然行不通。因为为了让我能够点击球,我必须点击当时球所在的确切中心像素。所以我的问题是我该怎么说:如果点击接近或大约等于球的当前位置,那么回到顶部。我是一个菜鸟,所以如果我问愚蠢的问题,我道歉,我正在努力学习。非常感谢您的帮助。我很感激。
c++ - 使用“近似”STL 映射
我想创建一个 STL 映射来查找一个项目是否足够接近 3 维空间中的另一个项目。到目前为止,我的“小于函子”运行良好,粘贴到以下链接。
现在这个问题还不是“最近邻”问题。相反,这是一个“在一定距离内是否有邻居”的问题。
我的示例仅显示一个维度。为了清楚起见,我跳过了 Y/Z 尺寸。
在极少数情况下,我的意思是——非常罕见——当位置重叠时,地图找不到匹配的条目。
仍然使用 STL 容器,我可以做些什么来更好地实现这一点?
c# - 比较与自适应近似相等的双打
我正在尝试制作一个自适应的“大约相等”方法(用 C# 编写,但问题很笼统)接受两个双精度数并返回一个布尔值,如果它们“大约相等”或不“大约相等”。通过自适应,我的意思是:
1.234 和 1.235 ==> 真
但
1.234567 和 1.234599 ==> 错误
也就是说,“大约相等”的精度适应数字的精度。
我在如何找到两个变量是否近似相等?但是对于 epsilon 使用什么仍然存在开放式问题。
有人知道此类问题的最佳实践吗?提前致谢!
编辑:我最初的问题没有包含足够的信息来说明我想要得到什么。很抱歉,我很抱歉。我想要一个程序,它可以将更高的精度数字处理为更高的标准,同时对更低的精度数字更宽容。对的更多示例是(其中 '(0)' 是隐含的零):
1.077 和 1.07(0) 返回 false(因为 77 与 70 非常不同)
1.000077 和 1.00007(0) 返回 false(因为 77 与 70 非常不同)
1.071 和 1.07(0) 返回 true(因为 71 接近 70
1.000071 和 1.00007(0) 返回 true(因为 71 接近 70)
无论实现代码如何,我都假设会有某种“公差”变量来确定什么是“非常不同”和什么是“接近”。
opencv - OpenCV - 在偏移处绘制轮廓
我正在使用 OpenCV 进行图像处理。我正在寻找一个人体,我想隔离(段)。
目前,我能够找到身体的轮廓,并用多边形近似轮廓。接下来,我想在 cvWatershed 中使用该轮廓,以真正隔离身体。
有谁知道我如何在向中心偏移处绘制轮廓?为了说明,请参见下图。
蓝色:轮廓的多边形近似
红色:我想要的多边形,但找不到。(在上图中,我使用了 Photoshop...)
这是我查找和绘制当前轮廓的方法:
编辑:根据以下答案,我找到了两种解决方案:
recursion - RSpec 是否支持递归近似匹配?
在 RSpec 我可以做这样的事情:
有没有一种内置的方法可以使这个递归近似?例如:
如果没有内置的方法,我意识到我可以(并且将)自己写这个。
algorithm - 蜂巢中top-k查询的近似算法?
每个人,在蜂巢中,我们使用
用于前 N 个查询。
由于我们知道速度并不快,所以我学习了一些用于top-k查询的近似算法,例如countsketch算法或其他算法。
我们可以在 hive 中添加近似算法以加快 top-k 查询吗?
r - 从 R 中文本字符串的第一个近似匹配中提取信息(并对匹配的总数求和)
我无法对文本字符串的近似匹配求和,以及从第一次匹配的字符串中提取信息。
我有看起来像这样的数据:
请注意,最新的文本字符串在较早的文本字符串中添加了全大写“THEN”和“AT”。
我想要一个看起来像这样的表:
这包括:
与最早日期的文本对应的ID号(其他文本源自的“原始”文本)。 每个的所有近似匹配的总和。与最早日期对应的文本。并且文本的日期与最早的日期相对应。
我有数千万个案例,所以我在自动化流程时遇到了麻烦。
我运行 Windows 7,并且可以访问快速计算服务器。
想法
从这里,我可以使用“agrep”,但我不确定在什么情况下。任何帮助将不胜感激!
注意:虽然下面的三个答案确实以我最初提出的方式回答了我的问题,但我没有提到即使没有“AT”和“THEN”这两个词,我的文本案例也会有所不同。事实上,它们中的大多数并不完全匹配。我应该把它放在原来的问题中。但是,我仍然希望得到一个答案。
谢谢!
string - Excel 近似文本匹配
我正在尝试检查 A 列中有多少字符串与 B 列中的字符串大致匹配。
例子:
如果我在 B 列中有字符串“angry_birds_iph_app”,并且“angry_birds_iph_app”和“angry_birds_adrd_app”出现在 A 列的某处,我希望函数返回 2。
c++ - 近似字符串匹配的概率预选
我最近的任务是开发一种算法来检查数据库中的重复客户记录。DB 布局非常简单:数以万计的行,包含 FullName、Street、City、ZIP、Phone 等字段。
先说一点背景:
我对算法进行了一些广泛的研究,并决定每个领域都应该使用不同的算法进行一定程度的权衡,因为并非所有领域在所有情况下都表现得一样好。例如,姓氏的权重因子为 0.50。当我评估时,我会选择要使用的算法以及它们对最终决定的影响:
因子 0.25:JaroWinkler
因子 0.60:余弦 2-Gram 相似
因子 0.15:DamerauLevenshtein
一切运行良好,稍加调整后,我检测到的积极因素几乎没有错误。到现在为止还挺好。但是,正如您可以想象的那样,在处理数万条记录时,运行时间为 O(n^2) - 或者实际上是 E 从 i=0 到 i=n - 并不是很有效。不用说,积极优化,使用编译器优化速度,多线程等,只是创可贴,因为真正的问题是复杂性。
本质上,我正在寻找一种预先过滤潜在匹配的方法,并且现在已经对此进行了三天的研究。我发现了一些关于 R-Trees、R*-Trees、KD-Trees、欧几里德向量、minhashing 等的有价值的信息。然而,关于所有这些的大多数信息都是相当学术性的。我发现的最有价值的资源是“挖掘海量数据集”,第 3 章。
现在到我真正的问题:
我已经阅读了所有这些信息,但我不确定如何将它们放在一起。
我正在考虑在树或图形数据结构中进行某种索引,我可以在其中输入一个字符串并说“找到所有匹配概率> 0.20的人”。这个算法应该非常快。然后,当我得到一个潜在的(>0.20)匹配列表时,我可以去比较几个项目和我的“昂贵”但有选择性的算法。我认为这应该将运行时间减少到一个非常合理的值。
我一直在尝试找到某种参考代码来做我想做的上面的事情,但除了学术文章之外,我似乎没有想出任何东西。我确实找到了实际编译的“simstring”,但似乎与 7 条测试记录不太匹配。有人能指出我正确的方向吗?肯定有人以前遇到过这个问题并找到了解决方案......
非常感谢您!
PS 我在 C++ 中执行此操作,但 C#/C/Java/PHP 中的任何示例都可以。