问题标签 [sklearn-pandas]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1212 问题

0 投票

1 回答

4469 浏览

python-2.7 - 如何使用 Pandas（python）读取 7z 文件并将其转换为 csv？

我有 7z 个文件，我想使用 Pandas 将它们转换为 csv 来预处理数据。我有python 2.7。

我试过这个：

我收到了这个错误

这附近有什么问题？

2016-12-16T20:28:10.257

0 投票

1 回答

1346 浏览

python - 将任何 sklearn 结果映射回原始数据帧

我想以原始测试数据作为参考，在 excel 中分析我的随机森林结果的预测值。

当我使用这个时，预测的结果出现在一个数组中：

如何使用 pandas 将预测结果映射回原始数据集？

问候，加利杰

python pandas scikit-learn sklearn-pandas

2016-12-19T08:51:04.517

0 投票

0 回答

53 浏览

python - 在 .net 解决方案中包含 Python 脚本

我有一个 Python 2.7 脚本，它执行以下操作：

从数据库中读取数据并使用 numpy 和 pandas 操作它们
使用 sklearn 进行聚类
将这些数据写入数据库

我想将此脚本包含在 .net 解决方案中，但我不知道从哪里开始。

一些可能性：

从解决方案中的 .net 模块调用脚本。不喜欢这样，因为我们需要在客户的服务器上部署解决方案，所以他们应该看不到脚本
创建一个可执行文件，该文件接受一些输入（例如 db 地址）并以某种方式（不知道如何）在“内部”解决方案。

有什么建议吗？

python .net numpy sklearn-pandas

2016-12-20T14:00:03.647

0 投票

7 回答

23321 浏览

python - 尝试导入 sklearn 模块时出错：ImportError: DLL load failed: The specified module could not be found

我尝试为机器学习项目进行以下导入：

我收到此错误消息：

请帮助我尝试了一切，但没有任何效果。我也尝试了这些解决方案： ImportError: DLL load failed: Le module spécifié est introuvable

ImportError：DLL 加载失败：找不到指定的模块

python machine-learning dll sklearn-pandas

2016-12-26T15:00:29.443

0 投票

1 回答

518 浏览

python - 导入整个模块与仅从 python 中的模块导入所需的方法有什么区别？

在使用 scikit learn 或其他类似的 Python 库时，这样做有什么区别：

和

使用一种方式比另一种方式有什么优势吗？

python scikit-learn sklearn-pandas

2016-12-28T18:41:47.033

0 投票

1 回答

5862 浏览

pandas - 当定义的掩码为真时如何更改特定列的值？

我有一个数据框，其中有这些列名

'团队 1',
'团队 2',
'城市'，
'日期'。

我想要做的是在满足某些条件时将“城市”的值指定为“迪拜”（我使用掩码定义）。

这就是我正在做的事情：

当满足上述所有条件时，我想将“城市”（现在为空）中的值更改为“迪拜”

出现的问题：

“系列”对象是可变的，因此它们不能被散列

我怎样才能做到这一点？

pandas dataframe sklearn-pandas

2016-12-29T18:28:15.527

0 投票

1 回答

141 浏览

python - 根据列将数据框分为两组

我有 Dataframe df，我选择了一些数据框，我想根据名为 Sevrice 的库将它们分成 xtrain 和 xtest。这样原始的 1 和 o 进入 xtrain 和 nan 进入 xtest。

已编辑

我收到此错误logistic.predict(xtest)

python pandas logistic-regression sklearn-pandas

user7308269

2017-01-01T13:22:30.593

0 投票

3 回答

269 浏览

python - 将 Numpy 数组映射到字符列表

给定一个两个昏暗的 numpy 数组：

和转换字典：

d = {-1:'a', 0:'b', 1:'c'}

如何将原始数组映射到字符组合列表？

我需要的是以下列表（或数组）

输出 = ['aa', 'ac', 'cc', 'cc', 'cb', 'ba', ....]

（我正在做一些机器学习分类，我的类由 -1、0,1 的组合标记，我需要将“标签”数组转换为可读的东西，如“aa”、“bc”等）。

如果sklearn 包中有一个简单的函数（binarizer，或者 one-hot-encoding），可以将原始的凹凸数组转换为一组标签，那就完美了！

python arrays scikit-learn sklearn-pandas

2017-01-05T10:47:39.850

0 投票

1 回答

2542 浏览

python - statsmodel OLS和scikit线性回归的区别；不同的模型给出不同的r平方

我是 python 新手，并试图计算一个简单的线性回归。我的模型有一个因变量和一个自变量。我正在使用 sklearn 包中的 linear_model.LinearRegression() 。我得到了 0.16 的 R 平方值然后我使用 import statsmodels.api as sm mod = sm.OLS(Y_train,X_train) 得到了 0.61 的 R 平方值。下面是从大查询中获取数据的代码

我对此很陌生。试图了解我应该使用哪个线性回归包？

python linear-regression statsmodels sklearn-pandas

2017-01-05T22:15:37.963

0 投票

2 回答

3112 浏览

python - 如何使用 sklearn 的 CountVectorizer 进行矢量化和去矢量化？

我想将一些文本矢量化为相应的整数，然后将这些文本转换为其映射的整数，并使用新的输入整数创建新句子[2,9,39,46,56,12,89,9]。

我已经看到了一些可以用于此目的的自定义功能，但我想知道 sklearn 本身是否具有此类功能。

python scikit-learn sklearn-pandas

2017-01-14T12:26:25.453

1 2 3 4 5 6 7 8 9 10

问题标签 [sklearn-pandas]

Reference