问题标签 [machine-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
artificial-intelligence - How does Wolfram Alpha work?
Behind the tables and tables of raw data, how does Wolfram Alpha work?
I imagine there are various artificial intelligence mechanisms driving the site but I can't fathom how anyone would put something like this together. Are there any explanations that would help a programmer understand how something like this is created? Does the knowledge base learn on its own or is it taught very specific details in a very organized manner? What kind of structure and language is used to store this type of data?
Obviously this is a huge question and can't fully be answered here but some of the general concepts would be nice to know so I can build off of them and do my own research.
algorithm - 生成算法和判别算法有什么区别?
生成算法和 判别算法有什么区别?
c# - 错别字的机器学习
当您输入错字时,Google 会提出建议,他们是如何做到的?
machine-learning - 需要好的方法来选择和调整“学习率”
在下图中,您可以看到一个学习算法试图学习产生所需的输出(红线)。学习算法类似于反向误差传播神经网络。
“学习率”是一个控制训练过程中调整大小的值。如果学习率太高,那么算法学习很快,但是它的预测在训练过程中跳跃很多(绿线 - 学习率 0.001),如果它较低,那么预测跳跃更少,但是算法需要一个学习时间更长(蓝线 - 学习率为 0.0001)。
黑线是移动平均线。
如何调整学习率,使其最初收敛到接近所需的输出,但随后减慢速度以便它可以磨练正确的值?
学习率图 http://img.skitch.com/20090605-pqpkse1yr1e5r869y6eehmpsym.png
windows - 有多少设备驱动程序可用于 Windows
为了方便计算,我试图估计有多少不同的设备驱动程序可用于 Windows。我试图了解在收集数据的大小和处理能力方面可能需要什么来对驱动程序进行一些统计分析。
有人有参考吗?想法?在这一点上,有根据的猜测将不胜感激。
arrays - 大规模数据集的核方法
由于两个实例之间的内积计算,基于内核的分类器通常需要 O(n^3) 的训练时间。为了加快训练速度,可以预先计算内积值并将其存储在二维数组中。然而当没有。的实例非常大,例如超过 100,000,将没有足够的内存来执行此操作。
那么有什么更好的主意吗?
python - 你如何让这段代码更 Pythonic?
你们能告诉我如何使以下代码更具pythonic吗?
代码是正确的。完全公开 - 这是本机器学习课程的讲义 #4 中的问题 1b。我应该在两个数据集上使用牛顿算法来拟合逻辑假设。但是他们使用 matlab 而我使用的是 scipy
例如,我遇到的一个问题是矩阵一直四舍五入到整数,直到我将一个值初始化为 0.0。有没有更好的办法?
谢谢
java - K-均值算法
我正在尝试用 Java 编写一个 k-means 算法。我计算了许多数组,每个数组都包含许多系数。我需要使用 k-means 算法来对所有这些数据进行分组。你知道这个算法的任何实现吗?
谢谢
algorithm - 指向一些好的 SVM 教程的指针
我一直在努力掌握支持向量机的基础知识,并下载并阅读了许多在线文章。但还是没能掌握。
我想知道,如果有一些
- 不错的教程
- 可用于理解的示例代码
或者你能想到的东西,这将使我能够轻松地学习 SVM 基础知识。
PS:我以某种方式设法学习了 PCA(主成分分析)。顺便说一句,你们会猜到我正在研究机器学习。
machine-learning - 使用熵的加权决策树
我正在使用互信息增益作为分裂函数来构建二分类树。但由于训练数据偏向少数类,建议通过逆类频率对每个训练示例进行加权。
如何加权训练数据?在计算估计熵的概率时,我是否采用加权平均值?
编辑:我想要一个带有权重的熵的表达式。