问题标签 [fuzzy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - 输入必须为空或格式字符串
嗨,我一直收到一个错误:
???使用 ==> textscan 时出错 第二个输入必须为空或格式字符串。
我试过这个方法:
但得到错误:
artificial-intelligence - 模糊k-mode聚类隶属度值计算
我正在寻找一种聚类算法来模糊聚类分类属性,我发现了k-modes 算法 我已经掌握了它的工作方式,但我不明白成员资格或归属矩阵的计算方式是否与模糊中的该矩阵相同c-means算法?在“否”的情况下,您介意澄清它的计算方式吗?
预先感谢您的帮助
artificial-intelligence - 模糊 K 模式聚类如何找到聚类中心
我试图理解模糊 k 模式算法(主要看第 3 页)以实现它。我被困在他们所说的集群中心的计算上,如图所示
我需要知道以下是真是假,请纠正我
为了获得集群的中心,我们需要:
- 对于变量中的每个类别,计算该类别所属的所有点的成员值总和到该集群
- 将获得的最高值设置为中心的类别
php - 从PHP中的字符串中提取日期
如何从任意字符串中提取日期,例如“Joe Soap 出生于 1981 年 2 月 12 日”?
python-dateutil
如本问题所述, Python 具有出色的模糊解析功能。
我正在寻找一个在 PHP 中提供相同类型功能的库。
database - Matching fuzzy strings
I have two tables that I need to merge together in PostgreSQL, on the common variable "company name." Unfortunately many of the company names don't match exactly (i.e. MICROSOFT in one table, MICROSFT in the other). I've tried removing common words from both columns such as "corporation" or "inc" or "ltd" in order to try to standardize names across both tables, but I'm having trouble thinking of additional strategies. Any ideas?
Thanks.
Also, if necessary I can do this in R.
matlab - 如何在 Matlab 或 R 中进行重叠聚类分析?
我有一个大小为 20 x 300 的二进制矩阵。我想将 20 个变量聚集成五六组。到目前为止,我在 matlab 中使用了具有不同距离度量的 kmeans 和层次聚类算法,但两者都给了我不重叠的聚类。我从我的数据中看到,一些变量应该位于多个组中。有谁知道是否有办法在matlab ot R中进行重叠集群?任何帮助是极大的赞赏。提前致谢!
r - R中“Firstname Lastname”/“Lastname Firstname”的顺序无关模糊匹配?
我有两个单独收集的同一组学生的姓名列表。有许多印刷错误,我一直在使用模糊匹配来链接这两个列表。我在那里有 99+%agrep
和相似,但我被困在以下基本问题上:我如何匹配(例如)名字“Adrian Bruce”和“Bruce Adrian”?Levenshtein 编辑距离不适用于这种特殊情况,因为它计算替换次数。
这一定是一个非常普遍的问题,但我找不到任何标准的 R 包或例程来解决它。我想我错过了一些明显的东西......???
matlab - 计算 Sugeno 输出
我无法弄清楚 MATLAB 如何根据输入计算输出值。我设法弄清楚了 mamdami 函数的工作原理(通过面积和质心),但是我无法理解如何计算输出。
下面的链接确实给出了公式,但我不明白如何应用这个......所有的权重都是 1,这个系统目前有三个规则。
http://www.mathworks.co.uk/help/toolbox/fuzzy/fp49243.html
帮助将不胜感激
java - 如何检测页面中是否包含句子(模糊)?
我一直在寻找一段时间,但到目前为止没有找到适合我需要的东西。(这很有帮助,但没有说服力)
从两个不同的来源,我得到两个不同的字符串。我想检查较短的是否包含在较大的中。但是,由于这些字符串都以 OCR 文档为根,因此可能存在明显差异。
例子:
如何在不使用独立 Lucene/Solr 安装的情况下在页面中可靠地找到我的字符串?(或者也许我只是没有找到教程/手册)。一定有一些图书馆可以做到这一点,对吧?
sql-server - Sql Server 全文:听起来相似的人名
我有一个数据库,里面有很多客户。系统的用户希望能够通过姓名等方式查找客户的帐户。
我所做的是创建一个名为 CustomerFullText 的新表,它只有一个 CustomerId 和一个 nvarchar(max) 字段“CustomerFullText”。在“CustomerFullText”中,我将我为客户拥有的所有文本(例如名字、姓氏、地址等)连接在一起,并且我在该字段上有一个全文索引,以便用户只需输入一个搜索框并获得匹配的结果。
我发现这给出了更好的结果,尝试搜索存储在许多不同列中的数据,尽管我想我有兴趣听到这本身是否是一个糟糕的主意。
许多人的名字听起来相同,但拼写不同:Katherine、Catherine 和 Catharine,也许数据库中记录的人是 Katherine,但自称是 Kate。还有,麦当劳对麦克唐纳,丽兹对伊丽莎白,等等。
因此,我正在做的是,在正确存储原始名称的同时,在构建全文之前进行一系列替换。因此,所有的 Katherine 和 Catheine 等在全文字段中都替换为“KATE”。在查询数据库之前,我对搜索参数进行了相同的转换,因此在搜索框中键入“Catherine”的人实际上会针对数据库中的全文索引运行“KATE”查询,这将匹配 Catherine AND Katherine等等。
我的问题是:这是否复制了现有 SQL Server 全文功能的任何部分?我看过了,但我认为这与自定义词干分析器或分词器或类似内容不同。