问题标签 [approximate]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
522 浏览

integer - 部分 StretchDIBits 时图像抖动

我正在使用 C++ GDI、StretchDIBits 在 DC 上绘制图像。

因为原始图像很大,需要高质量。我使用 HAFTONE 模式,在 DC 上绘制整个图像(缩放图像)似乎需要时间。

所以我决定使用 StretchDIBits 进行部分绘制。但是关于 StretchDIBits 有一个严重的问题。

我只能将整数中的矩形绘制到整数中的区域(宽度和高度,以及x,y的左上角都是整数)

如果,图像是 21 * 21 。我现在在 (20, 20, 60,60) 向 DC 画 (5, 5, 7, 7),下次我想在 (21, 20, 61, 60) 画。原图没有对应的位置。所以我只能画一个近似矩形到 DC。现在问题发生了,图像在颤抖!

我对这个问题很生气。我怎样才能避免晃动?

0 投票
2 回答
17578 浏览

search - 如何使用与 Solr 的 n-gram 近似匹配?

我们有一个电影和连续剧数据库,并且由于数据来自许多不同可靠性的来源,我们希望能够对剧集的标题进行模糊字符串匹配。我们在应用程序中使用 Solr 进行搜索,但默认匹配机制在单词级别上运行,这对于短字符串(如标题)来说不够好

过去我使用过 n-gram 近似匹配,我很高兴发现 Lucene(和 Solr)支持这种开箱即用的东西。不幸的是,我无法正确配置它。

我假设我需要一个特殊的字段类型,所以我在我的 schema.xml 中添加了以下字段类型:

并将架构中的相应字段更改为:

但是,这并没有像我预期的那样工作。查询分析看起来正确,但我没有得到任何结果,这让我相信在索引时发生了一些事情(即,标题被索引为默认字符串字段而不是 trigram 字段)。

我正在尝试的查询类似于

(有一两个错字)并且它应该匹配“Guy Walks into a Psychiatrist Office”。

(我不确定查询是否正确。)

此外,我实际上希望能够做更多的事情。我想将字符串小写,删除所有标点符号和空格,删除英语停用词,然后将字符串更改为三元组。但是,过滤器仅在字符串被标记后应用......

提前感谢您的回答。

0 投票
1 回答
391 浏览

c - Finding multiple regex hits using approximate matching via the tre library

Using C, I'm trying to find the location and number of matches of a substring within another parent string. Because I also need to include approximate (hamming distance) matches, I'm using the tre library found here: http://laurikari.net/tre/.

I'm having trouble understanding some of the documentation on the site, likely because I'm not too familiar with regex lingo. According to the tre documentation, I can get more specific information about 'submatches'. Are these the matches I'm looking for?

Thanks!

0 投票
2 回答
1839 浏览

search - 排序整数列表中的近似搜索算法

考虑一个整数数组(假设已排序);我想以最快的方式找到最接近给定整数的整数的数组索引。在有多种可能性的情况下,算法应该识别所有可能性。

示例:考虑 T=(3, 5, 24, 65, 67, 87, 129, 147, 166),如果给定的整数是 144,那么代码应该将 147 标识为最接近的整数,并给数组索引 7对应于该条目。对于 66 的情况,算法应该识别 65 和 67。

是否有 O(1) 或至少 O(log N) 算法来做到这一点?直接搜索算法(二分搜索、树搜索、散列等)实现将不起作用,因为它们需要完美匹配。有什么办法可以修改这些来处理近似搜索?

我正在开发一个 C 代码。

谢谢

0 投票
2 回答
1071 浏览

django - Django 将 unicode 字符串与 ascii 等效项进行近似匹配

我有以下模型和实例:

现在我希望能够搜索对象,但使用 ascii 字符而不是 unicode,如下所示:

在 Django 中有没有办法进行这种近似字符串匹配,使用 ascii 替代数据库中的 unicode 字符?

这是一个相关的问题,但针对 Apple 的核心数据。

0 投票
2 回答
5146 浏览

java - 用于近似字符串匹配的示例 java 代码或用于近似字符串匹配的 boyer-moore 扩展

我需要在乐曲(例如存储在表格中的音符音高[字符串值])中针对参考找到 1.mismatch(错误演奏的音符)、2.insertion(附加演奏)和 3.deletion(遗漏的音符)音乐片。

这可以通过精确字符串匹配算法或动态编程/近似字符串匹配算法来实现。但是我意识到,由于识别不匹配、插入、删除注释,近似字符串匹配更适合我的问题。或 Boyer-moore 的扩展版本以支持大约。字符串匹配。

是否有示例 java 代码的链接我可以尝试近似字符串匹配?我找到了复杂的解释和方程式——但我希望我能用一些示例代码和简单的解释做得很好。或者我可以在 boyer-moore 上找到任何示例 java 代码扩展约。字符串匹配?我理解 boyer-moore 的概念,但是在调整它以支持大约。字符串匹配(即支持不匹配、插入、删除)。

还有什么是最有效的。字符串匹配算法(如精确字符串匹配算法中的 boyer-moore)?

非常感谢任何见解/建议。提前谢谢了

0 投票
2 回答
1701 浏览

java - 用一组点逼近一条 R2 线

我正在开发一个带有统计分析的应用程序,我需要一些帮助。给定一组 n 个点,我如何用它们近似一条线。我确定有一个算法,但我找不到它。

谢谢!

0 投票
2 回答
844 浏览

java - Java的近似正则表达式库?

我刚刚写了一些近似字符串匹配的代码。我想将我的幼稚算法与在 JVM 上运行的更成熟的实现进行基准测试。有什么建议么?

0 投票
5 回答
8141 浏览

c# - 如何找到最接近任意(非成员)数字的数组元素?

看似相似的问题:“在数组中查找最接近的数字”(在 Java 中)和“找到与双精度数组最近的匹配”(实际上是一个地理问题)。

我有一个(排序的)双打数组。给定一个任意数字(可能与数组元素之一完全匹配,也可能不完全匹配),我如何返回最接近匹配的数字的索引?

例如,使用以下数组:

  • 1.8
  • 2.4
  • 2.7
  • 3.1
  • 4.5

查询 2.5 将返回索引 1,对应于 2.4 的值。

检测完全超出数组元素范围的值的奖励积分。例如,使用上面列出的数组,您的代码可能会确定 4.6 进入,但 5.9 退出。如果您想尝试这部分问题,具体情况掌握在您手中。

0 投票
4 回答
13432 浏览

c# - 近似字符串匹配

我知道这个问题已经被问了很多次了。我想要一个关于哪种算法适合近似字符串匹配的建议。

该应用程序专门用于公司名称匹配,仅此而已。

最大的挑战可能是公司名称部分和简称部分示例: 1. companyA pty ltd vs companyA pty。有限公司 vs companyA 2. WES Engineering vs WES Engineering(极少出现)

您认为 Levenshtein Edit Distance 是否足够?

我正在使用 C#

问候, 马克斯