问题标签 [scikits]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
9977 浏览

python - scikit-learn roc_auc_score() 返回准确度值

我正在尝试sklearn.metrics.roc_auc_score使用以下方法计算 ROC 曲线下的面积:

其中actual是具有地面实况分类标签predicted的二元向量,是具有分类标签的二元向量,我的分类器已预测。

但是,roc_auc我得到的值与准确度值(标签被正确预测的样本的比例)完全相似。这不是一次性的事情。我在参数的各种值上尝试我的分类器,每次我得到相同的结果。

我在这里做错了什么?

0 投票
1 回答
989 浏览

cluster-analysis - 选择和实施聚类方法:DBSCAN 还有什么?

我需要对经纬度坐标的数据集进行聚类。我使用 python 作为我的语言并计划使用 DBSCAN,因为我不想指定集群的数量。

目标和目的是能够输入包含许多附加特征的经纬度坐标的大型数据集,并分配将返回的集群组。包含 [lat long feature1, feature2 ....] 形式的条目的原始数据库需要用一个名为“cluster group”的新字段进行修改:[lat long clustergroup feature1, feature2 ....]。这将帮助我确定哪些数据点紧密地组合在一起,而无需在地图上绘制。我希望异常值将被赋予单独的组 ID,并且很大程度上聚集在一起的点将被赋予相同的组 ID。

在我转换 lat,long -->x,y 并忽略 z 坐标之后,我对 DBSCAN 的输入将是 x,y 坐标。我在用:

http://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html#sklearn.cluster.DBSCAN http://scikit-learn.org/stable/auto_examples/index.html

我很难理解如何设置此功能的输入。我可以输入 x,y 坐标吗?这会是一个元组列表吗?如果有人可以帮助我想象这一点,那将是一个很大的帮助。

另外,您能解释一下 DBSCAN 与层次聚类有何不同吗?

0 投票
1 回答
2484 浏览

python - 在python中将图像转换为numpy数组

我第一次使用 Python + Scipy + Scikit-image + numpy。

我正在使用页面寻求帮助,我只是稍微更改了给定的代码以获取我喜欢的图像:

但我收到以下错误:

语法有什么问题?我在Windows上使用的是python 2.7,所有相关的工具包也是按照Python 2.7的。

我需要将图像转换为 2-D numpy 数组,以便我可以使用 canny 边缘检测器。

0 投票
2 回答
263 浏览

scipy - 如何分别拟合包含 csr_matrixs' 和标签的两个数组?

我正在尝试将单个特征向量(即 X_train[i])存储到数组 X 中,并将其对应的标签存储在另一个数组 Y 中。当我尝试拟合这两个数组时,出现错误 ValueError: setting an array element with a sequence . 如何修复此错误。提前致谢。

0 投票
1 回答
1658 浏览

scikit-learn - 如何在 Scikit KMeans 中使用预先计算的距离矩阵?

我是 scikit 的新手。
我在 Scikit KMeans 中找不到使用预先计算的距离矩阵的示例。
现在有人可以阐明这一点,举个例子更好吗?

0 投票
1 回答
2043 浏览

python - 使用观察权重绘制密度

有没有办法使用具有观察权重的数据来绘制密度?

我有一个观察x向量和一个整数权重向量y,这y1表明我们有多少观察x1。也就是说,密度

等于 1, 1, 2, 2, 2, 2 ,2(2x1, 5x2) 的密度。据我了解, matplotlib.pyplot.hist(weights=y)在绘制直方图时允许观察权重。是否有任何等效的计算和绘制密度?

我希望包能够做到这一点的原因是我的数据非常大,我正在寻找更有效的替代方案。

或者,我对其他软件包持开放态度。

0 投票
1 回答
308 浏览

cuda - 如何在 pycuda / scikits.cuda 中进行元素分配?

这是代码:

我收到以下错误:

那么有什么方法可以将矩阵分配给 pycuda/scikits.cuda 中的另一个现有矩阵?

0 投票
2 回答
2448 浏览

python - 在 Windows 上安装 scikit-bio 时遇到问题

当尝试使用 Python 2.78 和 Visual C++ 2008 Express Edition 在 Windows XP 上通过 pip 安装 scikit-bio 工具包时,该过程被 VC 发出以下消息中断:

关于这个错误,微软开发者网络网站只是说:

我(还)没有尝试在 Linux(Ubuntu 12.04 Precise)下安装 scikit-bio,但我的印象是它可以正常工作(就像 Linux 一样)。

有没有人在Windows(XP、7、8)下成功安装过scikit-bio?有什么提示吗?

提前致谢!

0 投票
1 回答
102 浏览

cuda - 如何将上/下 gpuarray 转换为 cublasStbsv 所需的特定格式?

我目前正在使用 pycuda 和 scikits.cuda 来求解线性方程 A*x = b,其中 A 是上/下矩阵。但是 cublasStbsv 例程需要特定的格式。举个例子:如果一个下矩阵A = [[1, 0, 0], [2, 3, 0], [4, 5, 6]],那么cublasStbsv需要的输入应该是[[1, 3 , 6], [2, 5, 0], [4, 0, 0]],其中行分别是对角线、下对角线 1、下对角线 2。如果使用 numpy,这可以通过 stride_tricks.as_strided 轻松完成,但我不知道如何使用 pycuda.gpuarray 做类似的事情。任何帮助将不胜感激,谢谢。我找到了pycuda.compyte.array.as_strided,但它不能应用于gpuarray。

0 投票
1 回答
852 浏览

python - 使用代理获取 Olivetti 人脸

我正在尝试从 sklearn 数据集中获取 Olivetti 面孔,但出现 URLError。我知道错误是因为通常我需要通过代理来处理任何外部请求。

在这种情况下,我看不到为 fetch_olivetti_faces() 方法声明代理 url 的选项。有关如何通过代理执行此请求的任何建议?