问题标签 [fuzzy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hash - 用固定缓冲区填充模糊散列算法的含义
填充缓冲区并将其传递给模糊散列实现(ssdeep/sdhash)的含义是什么。
我有 2 个缓冲区,我想检查它们的相似性,但是它们很短,这些工具无法在它们上运行。
缓冲液 A:AAAAAAAAAAAAAAA 缓冲液 B:AAAAAAA* B *AAAAAAA
如您所见,它们非常相似。
如果我用 0 填充它们(页面对齐):
缓冲区 A:AAAAAAAAAAAAAAA00000000000000....0000(4096 个字节的“0”)缓冲区 B:AAAAAAA* B *AAAAAAA00000000000000....0000(4096 个字节的“0”)
相似度得分为 15。
当我尝试用随机数据填充它们时(当然,两个缓冲区都添加了相同的随机数据)。相似度得分为 86。
我使用的两种填充技术的含义是什么?我应该使用它们吗?
sql - 列到列的模糊匹配
我试图找到一种方法,将表 1 中的一列干净数据与表 2 中的一列脏数据相匹配,而不对脏数据进行任何更改。我在想一个模糊匹配,但清理表中有太多条目,无法使用 CDE。因此,例如:
我正在尝试使用组号将保险公司与患者匹配。有匹配的方法吗?(幸运的是,组数实际上要长得多,并且在寻找单个组的患者时,模糊匹配效果非常好,因此它们似乎足够独特,可以在这里应用)。
在 SQL Server 2008 中工作。
sql - Access中的sql匹配
我有两个表,我试图在每个表的列上进行匹配。每个表上的列都是名称,并且已尽可能标准化。即使标准化这两列并不完全相同,我需要根据这些列将表格匹配在一起。
我已经完成了 InStr 函数,但我的老板不同意。内部连接也不行。我在试图找到第三种方法来做到这一点时不知所措。
表 1 中的列 - Jimmy Johns 三明治
表 2 中的列 - Jimmy John
我需要一个公式来捕获匹配并根据此示例连接表。我知道 InStr 可以为我做到这一点,但我需要一种不同的方式。
ssis - SSIS - 模糊分组列增量
我尝试对一列使用模糊分组并添加其他列作为通过,但是禁止通过的列的值会增加。
有没有人遇到过这个问题?
r - R中的模糊聚类与调查数据
我有一个调查数据,它有 18.406 行和 247 列。它有太多的李克特量表问题。当然,它有 NA。
我检查了类似的问题,并在该主题中看到了答案:R 中缺少数据的聚类分析但这对我不起作用。
我正在尝试使用模糊聚类方法。作为第一步,我使用“选择”功能对我想要检查的问题的数据进行子集化。现在我的数据具有“整数”值。之后,我尝试使用具有“雏菊”功能的差异矩阵。这允许 NA。在这一步之后,我使用了“fanny”。第一个参数需要相异矩阵 - 或数据框 - 并且在 "fanny" 中,不允许使用 NA。尽管使用 NA 删除行不是我正在寻找的解决方案。
我究竟做错了什么?
干杯,
python - SPSS 23 中的模糊病例对照匹配
我更新到SPSS 23
并且无法使案例控制匹配工作。带代码:
我得到:
我知道 unicode 错误可能与 python 编码有关(例如 UTF-8 而不是 cp1255),但我不知道如何在 SPSS 环境中更改编码。有任何想法吗?
r - 如何使用 GFC.GCCL 方法解决 R 的 frbs 包中的错误?
我正在使用5 折分层交叉验证在我的数据集上使用frbs
包。R
我已经实施了分层简历。frbs.learn
我在每个折叠中使用 GFS.GCCL 方法进行函数,并使用测试数据预测结果。我收到此错误以及 30 条相同的警告消息:
错误:找不到对象“temp.rule.degree”
警告:在 max(MF.temp[m, ], na.rm = TRUE) 中:max 没有非缺失参数;返回-Inf
我的代码写在下面:
我对错误和警告一无所知。请让我知道我应该做什么。
sql - 字符串或二进制数据会被模糊连接截断错误
我有下面的查询,我试图通过所有使用标量值函数的对象但是我得到一个字符串或二进制数据将被截断错误。请协助。
elasticsearch - elasticsearch中的模糊查询与模糊逻辑有关吗?
正如标题所述,Elasticsearch 的模糊查询中究竟有哪些与模糊逻辑相关的内容?
例如,给定一个字符串,带有fuzziness
of的模糊查询2
将返回所有 Levenshtein 距离为 2 的索引字符串。如果有多个匹配项,系统如何决定返回什么答案?
背后有模糊系统吗?一个具有三角函数(例如)并且可以用以下方式表示的函数:
我想要一个更理论的答案来解决模糊查询中究竟是fuzzy
什么?