原始论文和其他资源(维基百科)总是使用诸如within或up之类的表达式根据半径 ε(必须有多个MinPts
邻居)定义一个核心对象。这留下了解释这个半径是否包含的空间:如果距离(p,q)是精确的 ε,那么对象 qa 是 p 的邻居吗?
这显然非常重要,因为所有的定义都基于...
原始论文和其他资源(维基百科)总是使用诸如within或up之类的表达式根据半径 ε(必须有多个MinPts
邻居)定义一个核心对象。这留下了解释这个半径是否包含的空间:如果距离(p,q)是精确的 ε,那么对象 qa 是 p 的邻居吗?
这显然非常重要,因为所有的定义都基于...
邻域的原始dbscan 论文中的定义是 dist(p, q) <= eps。但是,大多数实现将使用数据库索引支持的任何范围查询。在大多数情况下,这不会产生影响,并且 OmG 是正确的,通过将最小的可表示数字添加到 eps 将有效地将 < 更改为 <=。
我认为这根本不重要。因为有不同的方法可以找到它的值,epsilon
而且它们都不是那么精确,而且它还取决于您要聚类的数据的结构。
而且,如果你epsilon
在指定的运行机器上将开发语言的精度改成多一点,这个问题就可以解决了,他们根本就不是他们的邻居!因此,由于这个问题对该机器的精度很敏感,这意味着在大多数一般情况下,它对你的最终结果不能起到至关重要的作用。