问题标签 [scikits]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3711 浏览

python - scikits audiolab安装错误

我正在使用 mint Linux Mint 13 maya (linux 3.2.0-23-generic x86-64)
我正在尝试安装 scikits.audiolab 来执行一些音频信号处理。我已经下载了所有先决条件,即(python-dev python-numpy python-setuptools libsndfile-dev)。我已将 site.cfg 设为

我收到以下错误

当我做'$定位声音'时,我得到

如何让 setup.py 找到库。有什么我想念的吗?我在 Ubuntu Oneiric 上看到了http://forum.ubuntu-fr.org/viewtopic.php?pid=3748397scikits.audiolab - ImportError: No module named _sndfile

这造成了如此多的挫败感

更新

在我的一台 PC 中,完全卸载 scikits-audiolab 和 alsa 并在重新安装 alsa 和 scikits-audiolab 之前更新 apt-get 后,此错误已被删除。

0 投票
2 回答
2098 浏览

python - 螃蟹:为什么螃蟹的 UserBasedRecommender 这么慢?

螃蟹的基准是(http://www.slideshare.net/marcelcaraciolo/crab-a-python-framework-for-building-recommender-systems page-37)

但是,就我而言,我需要花费 30 多分钟才能完成,我不知道原因

我的代码是

我的数据是 NumpyMovieLens 100k,其中包含来自 1000 名用户对 1700 部电影的 100,000 条评分。

0 投票
3 回答
15882 浏览

python - Python统计包:statsmodel和scipy.stats的区别

我需要一些关于为 Python 选择统计数据包的建议,我已经做了很多搜索,但不确定我是否一切都正确,特别是关于 statsmodels 和 scipy.stats 之间的差异。

我知道的一件事是具有 scikits 命名空间的那些是 scipy 的特定“分支”,而过去的 scikits.statsmodels 现在称为 statsmodels。另一方面,还有 scipy.stats。两者有什么区别,哪个是Python统计包?

谢谢。

- 编辑 -

我更改了标题,因为有些答案与问题并没有真正相关,我想那是因为标题不够清楚。

0 投票
1 回答
295 浏览

machine-learning - Scikits NB 与 NLTK NB 的性能对比

我通过绘制我的 3类问题。X 轴是训练数据集大小(忘记实际值),Y 是准确度。这是我得到的。

这种性能差异有什么原因吗?

0 投票
2 回答
7738 浏览

python - 如何在 python scikit-learn 随机森林中使用虚拟变量来表示分类数据

我正在为 scikit-learn 的随机森林分类器生成特征向量。特征向量代表9个蛋白质氨基酸残基的名称。有 20 个可能的残基名称。因此,我使用 20 个虚拟变量来表示一个残基名称,对于 9 个残基,我有 180 个虚拟变量。

例如,如果滑动窗口中的 9 个残基是: ARNDCQEGH(每个字母代表一个蛋白质残基的名称),我的特征向量将是:

另外,我尝试使用 (1,0) 替换 (True,False)

在训练和测试 Scikit 的随机森林分类器模型后,我发现它完全不起作用。但是 Scikit 的随机森林可以与我的其他数值数据一起使用。

Scikit 的随机森林可以处理分类变量或虚拟变量吗?如果是这样,你能提供一个例子来说明它是如何工作的。

这是我设置随机森林的方法:

提前非常感谢!

0 投票
3 回答
2890 浏览

python - 用于信号处理的 Python 包

我正在寻找一个 Python 包来执行高效的常量 Q 变换(即使用 FFT 来加速该过程)。我找到了一个名为 CQ-NSGT/sliCQ Toolbox 的工具箱,但出现以下错误:

Numpy(我怀疑)或者更可能是 scikit audiolab 似乎存在问题。你知道问题出在哪里吗?

0 投票
2 回答
1836 浏览

python - 随机梯度提升产生不可预测的结果

我正在使用 Python 的 Scikit 模块来实现随机梯度提升。我的数据集有 2700 个实例和 1700 个特征 (x),并且包含二进制数据。我的输出向量是“y”,包含 0 或 1(二进制分类)。我的代码是,

gb = GradientBoostingClassifier(n_estimators=1000,learn_rate=1,subsample=0.5) gb.fit(x,y)

print gb.score(x,y)

一旦我运行它,并得到 1.0 (100%) 的准确度,有时我得到大约 0.46 (46%) 的准确度。知道为什么它的性能存在如此巨大的差距吗?

0 投票
1 回答
6658 浏览

python - (Python) 使用 scikits bootstrap 估计回归参数置信区间

我刚刚开始尝试通过 scikits 提供的一个不错的引导程序包: https ://github.com/cgevans/scikits-bootstrap

但是我在尝试从线性回归估计相关系数的置信区间时遇到了一个问题。返回的置信区间完全位于原始统计数据的范围之外。

这是代码:

这会产生 ci = [-0.605, 0.644] 的结果,但原始统计量是 r0=0.894。

我已经在 R 中尝试过这个,它似乎在那里工作正常: ci 像预期的那样跨越 r0。

请帮忙!

0 投票
1 回答
1494 浏览

python - (Python)哪些库对音频特征向量表示有好处?

推荐哪些 Python 库来补充 scikit learn(机器学习库)?

我有 .wav 文件,我想将其表示为特征向量,以便我可以执行音频识别。

scikit.audiolab 是一个好的候选人吗?

如果给出示例代码或参考,将非常感激,它将.wav文件读取到特征向量:)。

提前致谢!

0 投票
1 回答
3309 浏览

python - 线性判别分析

我将 sklearn.lda 用于分类目的,并且对打印平均分类错误的分数函数有点困惑。它是由留出一个 - 折刀决定的吗?我如何解释结果?它只是一个没有太多文档的浮点值。

提前致谢, EL