问题标签 [machine-learning]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
441 浏览

language-agnostic - 如何在对等系统中稳健但最少地分发项目

如果一个人有一个可以查询的点对点系统,那么他想

  • 减少整个网络的查询总数(通过广泛分布“流行”项目和“相似”项目一起)
  • 避免每个节点的过多存储
  • 在客户停机、硬件故障和用户离开(可能为档案管理员/历史学家检测稀有物品)的情况下,确保即使是中等稀有物品的良好可用性
  • 避免在网络分区的情况下查询无法找到匹配项

鉴于这些要求:

  1. 有没有标准的方法?如果没有,是否有任何受人尊敬但实验性的研究?我熟悉一些分配方案,但我还没有看到任何真正解决学习健壮性的东西。
  2. 我是否缺少任何明显的标准?
  3. 有人有兴趣研究/解决这个问题吗?(如果是这样,我很乐意将我这个周末拼凑的一个非常蹩脚的模拟器的一部分开源,并且通常会提供无用的建议)。

@cdv:我现在已经观看了视频,它非常好,虽然我不觉得它完全符合可插拔的分发策略,但它绝对是 90% 的方式。然而,这些问题突出了这种方法的有用差异,这些差异解决了我的一些进一步担忧,并为我提供了一些后续参考。因此,我暂时接受你的回答,尽管我认为这个问题是开放的。

0 投票
5 回答
4102 浏览

algorithm - 您如何根据文本内容进行分类?

如何根据内容自动查找文本类别?

0 投票
4 回答
28953 浏览

algorithm - 地图应用的聚类算法

我正在研究地图上的聚类点(纬度/经度)。对于快速且可扩展的合适算法是否有任何建议?

更具体地说,我有一系列纬度/经度坐标和一个地图视口。我正在尝试将靠近的点聚集在一起以消除混乱。

我已经有了问题的解决方案(见这里),只是我想知道是否有任何正式的算法可以有效地解决问题。

0 投票
2 回答
7781 浏览

artificial-intelligence - 机器学习、人工智能和软计算

这三个高度相关的领域之间有什么区别?是否有一个特定的整体,它们都是(除了 CS)的一部分?

0 投票
4 回答
17942 浏览

machine-learning - 实现支持向量回归的最佳 MATLAB 工具箱?

这篇关于 SVM 的 Wikipedia 文章中,有许多链接指向支持向量机的 MATLAB 工具箱的不同实现。任何人都可以建议在速度、易用性等方面哪些是最好的?

0 投票
2 回答
2130 浏览

matlab - 在matlab PNN中查找类概率并制作ROC图

我在 MATLAB 中设置了概率神经网络分类实验。sim我可以使用该命令获取未见数据的类。有什么方法可以得到分类器计算的类的概率?另外,有没有直接的方法来绘制接收器操作特性曲线并为我的分类器计算 ROC 下的面积?

0 投票
6 回答
969 浏览

statistics - 模拟/统计/预测的研究生学位?

我想知道是否有人对此有任何见解。我正在考虑去研究生院获得一些计算机科学相关的学位。我一直对使用统计软件包或模拟解决问题的人很感兴趣。我要学习什么才能对这些事情有广泛的了解?他们属于机器学习吗?谢谢

0 投票
18 回答
97206 浏览

algorithm - 谷歌“你的意思是什么?” 算法工作?

我一直在为投资组合管理工具开发一个内部网站。有很多文本数据、公司名称等。一些搜索引擎能够非常快速地响应“您的意思是:xxxx”的查询,这给我留下了深刻的印象。

我需要能够智能地接受用户查询,并且不仅可以使用原始搜索结果进行响应,还可以使用“您的意思是吗?” 当有一个很可能的替代答案等时的响应

[我在ASP.NET中开发(VB - 不要反对我!)]

更新:好的,如果没有数百万“未付费用户”,我怎么能模仿呢?

  • 为每个“已知”或“正确”术语生成拼写错误并执行查找?
  • 其他一些更优雅的方法?
0 投票
8 回答
14526 浏览

machine-learning - 贝叶斯网络教程

对于初学者来说,学习贝叶斯网络的最佳书籍是哪本书?

0 投票
2 回答
2082 浏览

artificial-intelligence - 衡量分类算法的性能

我手头有一个分类问题,我想用机器学习算法来解决(贝叶斯或马尔科夫可能,这个问题独立于要使用的分类器)。给定一些训练实例,我正在寻找一种方法来衡量已实施分类器的性能,同时考虑数据过度拟合问题。

也就是说:给定 N[1..100] 个训练样本,如果我对每个样本运行训练算法,并使用这些相同的样本来测量适应度,它可能会陷入数据过度拟合问题——分类器会知道训练实例的确切答案,没有太多的预测能力,使得适应度结果毫无用处。

一个明显的解决方案是将手工标记的样本分成训练样本和测试样本;我想了解选择具有统计意义的样本进行训练的方法。

非常感谢白皮书、书籍指南和 PDF!