问题标签 [scikits]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - Scikits Learn:线性核 SVM 中的特征权重
我正在处理文本分类问题(情感分析)。我想知道 scikit-learn 中是否有任何选项可以为特征添加“权重”(作为重要性的衡量标准)。我检查了文档,发现SVC 的属性“coefs”,定义如下:
但是,此属性似乎是只读的。
python - 为什么要在 Python 中结合 np.floor 函数和 // 运算符?
我正在阅读用 Python 编写的库 'scikits-image' 的源代码,我找到了下一行代码:
我不知道他们为什么要加入 NumPy 函数floor
和//
运算符。有什么理由这样做吗?我看不见。我觉得这是两次做同样的事情。
项目在这里
python - 在 iPython 中序列化我的 scikit-learn (sklearn) 网格搜索分类器时出现问题
我在iPython中从下面运行了网格搜索分类器:
http://scikit-learn.org/dev/auto_examples/grid_search_digits.html
然后尝试通过酸洗对其进行序列化,但收到以下回溯:
有解决办法吗?
我正在使用 iPython 和 sklearn 的最新测试版。
谢谢 :)
python - 使用 scikits.cuda.cula 感到困惑
我想使用一些 cula 功能,如 LU 分解或矩阵逆,但我对指针输入有一些问题。例如,使用 scikits.cuda.cula.culaDeviceSgetrf(m, n, a, lda, ipiv) 进行 LU 分解,需要使用指针 f "a" 参数,但 python 中没有明确的指针(我知道所有变量python 是由 ref) 。那么在这种情况下我应该怎么做呢?我应该使用 ctype 库来创建 python 吗?
这就是我想要做的:
status = _libcula.culaDeviceSgetrf(m, n, int(a), lda, int(ipiv)) TypeError: only length-1 arrays can be convert to Python scalars
当我尝试
回溯(最后一次调用):文件“”,第 1 行,在文件“/usr/local/lib/python2.7/dist-packages/scikits.cuda-0.042-py2.7.egg/scikits/cuda/cula .py",第 329 行,在 culaDeviceSgetrf status = _libcula.culaDeviceSgetrf(m, n, int(a), lda, int(ipiv)) TypeError: int() argument must be a string or a number, not 'GPUArray'
任何解决方案?
python - 谁能解释为什么`skimage.measure.perimeter(img)`返回这个结果?
当我测试scikit-image
方法时,我遇到skimage.measure.perimeter(image)
但无法解释这个函数的输出。
我误解了这个函数应该返回什么吗?我知道周长是围绕一个区域的路径。
注意:-
(1) 计算的周长和返回的周长之间的差异并不总是 4。因为有时它可以是 6,无论它是正方形、矩形还是任何其他多边形。
更新:=
(1)功能页面
cuda - NVIDIA CUFFT 限制使用 scikits.cuda 进行 FFT 的大小和批次
这个问题将在 Python 命令行中使用 scikits.cuda [1],但可以等效地在纯 C/CUDA 中尝试(我没有尝试过)。
我正在尝试为一维复杂到复杂的转换创建一个 CUFFT 计划,该转换将应用于许多输入(所以很多批次)。使用 Tesla C2050,我执行以下操作
最后一次尝试的计划引发 cufftAllocFailed 异常。如果我减小变换的大小(从 64K 开始),我可以得到一批 10'000,但目前我需要 64K 大小的变换。
我的问题是:这是 CUFFT 的硬性限制吗?如果是这样,在 CUDA [2] 或 CUFFT [3] 文档中的哪些地方指定了变换大小与批次(与维度?)的限制?
[1] http://scikits.appspot.com/cuda
[2] http://developer.download.nvidia.com/compute/DevZone/docs/html/C/doc/CUDA_C_Programming_Guide.pdf
[3] http:// /docs.nvidia.com/cuda/pdf/CUDA_CUFFT_Users_Guide.pdf
python - 即使似乎已安装,也无法导入 scikits-learn
根据 scikit-learn 用户指南,我使用pip install -U scikit-learn
.
所以使用pip search scikit-learn
,我得到这个搜索结果:
但是当我进入 Python 并尝试import sklearn
使用ImportError: No module named sklearn
. 这真的应该刚刚奏效。
我在带有 NumPy 1.6.1 和 SciPy 0.10.1 的 Mac OS 10.6.8 上使用 Enthought 的 Python (2.7.3) 免费分发。是的,我知道 EPD Free 附带 scikit-learn,但 pip 应该升级我的版本,以便我可以实际使用 scikit-learn。
python - 获取给定时间序列的每月数据总和
我有timeseries
50 年的每日降雨量。我正在对冬季(10 月至 11 月)进行季节性趋势分析:
我有兴趣获得满足上述条件的一年中所有 10 月每日降雨量的总和> 1mm
。11 月份也是如此。
python - 使用 SciKit-learn 和大型数据集进行文本分类
首先,我昨天开始使用 python。我正在尝试使用 SciKit 和大型数据集(250.000 条推文)进行文本分类。对于该算法,每条推文都将表示为 4000 x 1 向量,因此这意味着输入是 250.000 行和 4000 列。当我尝试在 python 中构建它时,我在 8500 条推文后内存不足(使用列表并附加它时),当我预分配内存时,我得到了错误:MemoryError
(np.zeros(4000,2500000))。SciKit 不能处理这些大型数据集吗?我做错了什么(因为这是我使用 python 的第二天)?是否有另一种表示特征的方式,以便它适合我的记忆?
编辑:我想要伯努利 NB
编辑2:也许在线学习是可能的?阅读一条推文,让模型使用这条推文,将其从内存中删除,阅读另一个,让模型学习......但我认为 Bernoulli NB 不允许在 scikit-learn 中进行在线学习
python - sklearn.svm.SVC 没有给出稀疏数据集的支持向量索引?
sklearn.svm.SVC 没有给出稀疏数据集的支持向量索引。有什么技巧/方法可以获取 SV 的索引吗?