问题标签 [scikit-learn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1862 浏览

machine-learning - 如何在 sklearn 的集成分类器中使用自定义分类器?

我读到 sklearn 中的内置集成方法使用决策树作为基本分类器。是否可以改用自定义分类器?

0 投票
5 回答
65499 浏览

python - 使用 scikit-learn 分类到多个类别

我正在尝试使用 scikit-learn 的一种监督学习方法将文本片段分类为一个或多个类别。我尝试过的所有算法的预测函数只返回一个匹配项。

例如我有一段文字:

我已经训练算法为我输入的每个文本片段选择一个位置。

在上面的示例中,我希望它返回New Yorkand London,但它只返回New York

是否可以使用 scikit-learn 返回多个结果?或者甚至返回具有下一个最高概率的标签?

谢谢你的帮助。

- -更新

我尝试使用OneVsRestClassifier,但每条文本仍然只有一个选项。下面是我正在使用的示例代码

结果:['纽约''伦敦''伦敦']

0 投票
2 回答
13491 浏览

machine-learning - 可视化决策树(来自 scikit-learn 的示例)

我是使用 sciki-learn 的菜鸟,所以请多多包涵。

我正在浏览这个例子: http ://scikit-learn.org/stable/modules/tree.html#tree

显然,graphiz 文件已经可以使用了。

但是如何使用 graphiz 文件绘制树呢?(该示例没有详细说明如何绘制树)。

示例代码和提示非常受欢迎!

谢谢!


更新

我正在使用 ubuntu 12.04,Python 2.7.3

0 投票
6 回答
143011 浏览

python - 在 scikit-learn 中将分类器保存到磁盘

如何将训练有素的朴素贝叶斯分类器保存到磁盘并使用它来预测数据?

我有以下来自 scikit-learn 网站的示例程序:

0 投票
1 回答
1942 浏览

python - Scikit-learn 模型参数不可用?如果是这样,还有什么 ML 工作台替代方案?

我正在按照这个问题中的建议使用 scikit-learn 进行机器学习。令我惊讶的是,它似乎无法访问它训练的实际模型。例如,如果我创建一个 SVM、线性分类器甚至决策树,它似乎无法让我查看为实际训练模型选择的参数。

如果模型的创建部分是为了更清楚地了解它正在使用的功能(例如,决策树),那么查看实际模型很有用。如果想要使用 Python 来训练模型并使用其他代码来实际实现它,那么查看模型也是一个重要问题。

我是否在 scikit-learn 中遗漏了一些东西,或者有什么方法可以在 scikit-learn 中解决这个问题?如果没有,什么是好的免费机器学习工作台,不一定是 python,其中模型是透明可用的

0 投票
1 回答
2204 浏览

python - scikit-learn CART 字符串数据

你能用字符串数据训练 DecisionTreeClassifier 吗?

当我尝试使用字符串数据时,我得到一个 ValueError: could not convert string to float

clf = DecisionTreeClassifier()
clf.fit([['asdf', '1'], ['asdf', '0']], ['2', '3'])

0 投票
1 回答
3005 浏览

python - Python scikits 学习 - 分离超平面方程

分离超平面的方程是W.X + b = 0

对于scikit-learn 中的支持向量机,分离超平面是如何得出的?a' ' 和 ' '是什么w意思?

0 投票
1 回答
5152 浏览

machine-learning - Libsvm 预计算内核

我正在使用带有预计算内核的 libsvm。我为示例数据集 heart_scale 生成了一个预先计算的内核文件并执行了函数svmtrain()。它工作正常并且支持向量被正确识别,即类似于标准内核。

但是,当我尝试运行时svmpredict(),它为预先计算的模型文件提供了不同的结果。在挖掘代码后,我注意到该svm_predict_values()函数需要支持向量的实际特征,这在预计算模式下不可用。在预计算模式下,我们只有每个支持向量的系数和索引,这被误认为是它的特征svmpredict()

这是一个问题还是我错过了什么。

(请让我知道如何svmpredict()在预计算模式下运行。)

0 投票
4 回答
95542 浏览

python - 如何将 csv 数据文件导入 scikit-learn?

据我了解,scikit-learn 接受 (n-sample, n-feature) 格式的数据,这是一个 2D 数组。假设我有表格中的数据......

我如何导入这个?

0 投票
3 回答
5760 浏览

python - 使用 scikit-learn 的顺序 k 均值聚类

有没有办法使用 scikit-learn 执行顺序 k-means 聚类?如果不重新拟合所有数据,我似乎找不到添加新数据的正确方法。

谢谢