问题标签 [sklearn-pandas]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
4469 浏览

python-2.7 - 如何使用 Pandas(python)读取 7z 文件并将其转换为 csv?

我有 7z 个文件,我想使用 Pandas 将它们转换为 csv 来预处理数据。我有python 2.7。

我试过这个:

我收到了这个错误

这附近有什么问题?

0 投票
1 回答
1346 浏览

python - 将任何 sklearn 结果映射回原始数据帧

我想以原始测试数据作为参考,在 excel 中分析我的随机森林结果的预测值。

当我使用这个时,预测的结果出现在一个数组中:

如何使用 pandas 将预测结果映射回原始数据集?

问候, 加利杰

0 投票
0 回答
53 浏览

python - 在 .net 解决方案中包含 Python 脚本

我有一个 Python 2.7 脚本,它执行以下操作:

  1. 从数据库中读取数据并使用 numpy 和 pandas 操作它们
  2. 使用 sklearn 进行聚类
  3. 将这些数据写入数据库

我想将此脚本包含在 .net 解决方案中,但我不知道从哪里开始。

一些可能性:

  1. 从解决方案中的 .net 模块调用脚本。不喜欢这样,因为我们需要在客户的服务器上部署解决方案,所以他们应该看不到脚本
  2. 创建一个可执行文件,该文件接受一些输入(例如 db 地址)并以某种方式(不知道如何)在“内部”解决方案。

有什么建议吗?

0 投票
7 回答
23321 浏览

python - 尝试导入 sklearn 模块时出错:ImportError: DLL load failed: The specified module could not be found

我尝试为机器学习项目进行以下导入:

我收到此错误消息:

请帮助我尝试了一切,但没有任何效果。我也尝试了这些解决方案: ImportError: DLL load failed: Le module spécifié est introuvable

ImportError:DLL 加载失败:找不到指定的模块

0 投票
1 回答
518 浏览

python - 导入整个模块与仅从 python 中的模块导入所需的方法有什么区别?

在使用 scikit learn 或其他类似的 Python 库时,这样做有什么区别:

使用一种方式比另一种方式有什么优势吗?

0 投票
1 回答
5862 浏览

pandas - 当定义的掩码为真时如何更改特定列的值?

我有一个数据框,其中有这些列名

  • '团队 1',
  • '团队 2',
  • '城市',
  • '日期'。

我想要做的是在满足某些条件时将“城市”的值指定为“迪拜”(我使用掩码定义)。

这就是我正在做的事情:

当满足上述所有条件时,我想将“城市”(现在为空)中的值更改为“迪拜”

出现的问题:

“系列”对象是可变的,因此它们不能被散列

我怎样才能做到这一点?

0 投票
1 回答
141 浏览

python - 根据列将数据框分为两组

我有 Dataframe df,我选择了一些数据框,我想根据名为 Sevrice 的库将它们分成 xtrain 和 xtest。这样原始的 1 和 o 进入 xtrain 和 nan 进入 xtest。

已编辑

我收到此错误logistic.predict(xtest)

0 投票
3 回答
269 浏览

python - 将 Numpy 数组映射到字符列表

给定一个两个昏暗的 numpy 数组:

和转换字典:

d = {-1:'a', 0:'b', 1:'c'}

如何将原始数组映射到字符组合列表?

我需要的是以下列表(或数组)

输出 = ['aa', 'ac', 'cc', 'cc', 'cb', 'ba', ....]

(我正在做一些机器学习分类,我的类由 -1、0,1 的组合标记,我需要将“标签”数组转换为可读的东西,如“aa”、“bc”等)。

如果sklearn 包中有一个简单的函数(binarizer,或者 one-hot-encoding),可以将原始的凹凸数组转换为一组标签,那就完美了!

0 投票
1 回答
2542 浏览

python - statsmodel OLS和scikit线性回归的区别;不同的模型给出不同的r平方

我是 python 新手,并试图计算一个简单的线性回归。我的模型有一个因变量和一个自变量。我正在使用 sklearn 包中的 linear_model.LinearRegression() 。我得到了 0.16 的 R 平方值然后我使用 import statsmodels.api as sm mod = sm.OLS(Y_train,X_train) 得到了 0.61 的 R 平方值。下面是从大查询中获取数据的代码

我对此很陌生。试图了解我应该使用哪个线性回归包?

0 投票
2 回答
3112 浏览

python - 如何使用 sklearn 的 CountVectorizer 进行矢量化和去矢量化?

我想将一些文本矢量化为相应的整数,然后将这些文本转换为其映射的整数,并使用新的输入整数创建新句子[2,9,39,46,56,12,89,9]

我已经看到了一些可以用于此目的的自定义功能,但我想知道 sklearn 本身是否具有此类功能。