问题标签 [unsupervised-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 稳健的聚类算法
假设我有项目 i1, ..., iN
我想以这样的方式对它们进行聚类:
- 如果我多次运行集群,项目 iJ 和 iK 最终在同一个集群中的概率很高。
- 无论集群种子如何,集群的数量和集群成员都相对稳定
是否有众所周知的算法来实现这一点?
澄清:
说我想要 3 个集群并说:
- 实际上,我从 i1、i33、i89 作为集群 c1 c2 c3 的种子开始
- 在现实 2 中,我从 i44、i55、i77 作为集群 c1 c2 c3 的种子开始
我希望两个现实中的结果集群大体相似
machine-learning - 为什么在无监督学习中不使用 DropOut?
所有或几乎所有使用 dropout 的论文都将其用于监督学习。似乎它可以很容易地用于规范深度自动编码器、RBM 和 DBN。那么为什么在无监督学习中不使用 dropout 呢?
python - scipy.optimize + kmeans 聚类
我为项目实施的 kmeans 聚类算法具有以下设置:
在这里,我的问题与 lossFunction 以及如何将其与 scipy.optimize 包一起使用。我想通过执行以下步骤迭代地最小化损失函数:
但是我对使用 scipy.optimize 包非常陌生,所以我写信是为了寻求有关如何调用scipy.optimize
来实现上述优化目标的帮助?
基本上我有 2m
个 xk
矩阵,我想lossFunction()
通过首先优化一个m
xk
矩阵保持另一个不变,然后在后续步骤优化第二个矩阵保持第一个常数来最小化 a。这可以被认为是期望最大化问题的一个特例,但不幸的是,到目前为止我还没有完全理解文档试图说的内容,因此我想我会求助于 SO。
提前致谢!
这是课堂作业的一部分,所以请不要发布代码!任何指导或解释将不胜感激。
audio - 距离相关的中餐厅流程可能
我是机器学习的新手,想在 MATLAB 中实现依赖于距离的中餐厅流程,以对音轨进行聚类。
我希望在 26 个功能上使用 dd-CRP。我猜这个过程可能是这样的
- 读入第一个特征向量并为其分配一个“表格”
- 读入第二个特征向量并将其与第一个“表”进行比较,可能使用两个向量的余弦角(由于高维),如果它在某个定义的 theta 内一致,则加入该表,否则开始一个新表。
- 读入下一个特征并对每个现有表的新特征向量重复步骤 2。
- 在发生这种情况时,我将跟踪有多少表。
我将在例如 16 个音轨上运行算法。将音频输入算法的方式是第一个特征向量来自音轨 1 的第一帧,第二个特征向量来自音轨 2 中的第一帧等,因为我试图找出哪个音轨最喜欢聚集在一起,但我不想定义有多少个质心。显然,我必须跟踪哪个音轨在哪个“桌子”上。
这有意义吗?
neural-network - Kohonen 网络 - 如何选择地图参数
http://xmipp.cnb.csic.es/NewXmipp/Web_Site/public_html/NewXmipp/Applications/Src/SOM/Help/som.html
示例 1:将存储在“test.dat”文件中的一组数据映射为 10x7 六边形图。
在这种情况下,他们已经使用 10*7 。此参数取决于数据大小或其他一些功能。
machine-learning - 使用 RBM 的深度自动编码器
我正在使用 RBM 实现深度自动编码器。我知道,为了展开网络,我们需要将编码器的转置权重用于解码器。但我不确定我们应该为解码器使用哪些偏差。如果有人可以为我详细说明或向我发送伪代码链接,我将不胜感激。
machine-learning - 遗传算法是无监督学习的一种形式吗?
我有一个非常简单的问题。但是,我进行了广泛的搜索,无法找到答案。遗传算法是否被认为是一种无监督学习形式?我知道算法是独立发展的,但是会定期测量群体中每个个体的适应度(监督?)。
我的算法的目标是通过遗传算法优化一组启发式权重。
谢谢您的帮助!——</p>
machine-learning - 人工神经网络中的无监督学习
如果我要使用遗传算法训练人工神经网络的权重,这将被归类为哪种类型的学习?我相信它是无人监督的,但它有名字吗?似乎它可能属于强化学习,但我不太确定。
data-mining - 以最高纯度切割树状图
我正在尝试创建使用分层凝聚聚类对文档进行聚类的程序,并且该程序的输出取决于将树状图切割到我获得最大纯度的级别。
所以以下是我现在正在研究的算法。
根据这个算法,我得到了在所有级别上计算出的纯度最高的簇。
问题是,当我在最低级别切割树状图时,每个簇只包含一个文档,这意味着它是 100% 纯的,因此簇的平均纯度为 1.0。但这不是所需的输出。我想要的是对文件进行适当的分组。难道我做错了什么?
node.js - 图像分类器/推荐器 - 无监督机器学习/神经网络/逻辑
因此,给定一组数十到数百张我无法控制的图像,但我知道它们被归类为 1/0,哪种技术最适合推荐/分类图像?
它需要是一个健壮的、可扩展的系统。我不知道哪些功能会起作用,这就是它的原因unsupervised learning
。
它需要强大且可扩展,因为每个用户有 10/100/1000 个图像。
我想使用 node.js
这个过程,所以如果你做过类似的事情并且有一个想法,请帮忙。
如果您需要更多信息,请告诉我。非常感谢。