问题标签 [sklearn-pandas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - 如何使用 Pandas(python)读取 7z 文件并将其转换为 csv?
我有 7z 个文件,我想使用 Pandas 将它们转换为 csv 来预处理数据。我有python 2.7。
我试过这个:
我收到了这个错误
这附近有什么问题?
python - 将任何 sklearn 结果映射回原始数据帧
我想以原始测试数据作为参考,在 excel 中分析我的随机森林结果的预测值。
当我使用这个时,预测的结果出现在一个数组中:
如何使用 pandas 将预测结果映射回原始数据集?
问候, 加利杰
python - 在 .net 解决方案中包含 Python 脚本
我有一个 Python 2.7 脚本,它执行以下操作:
- 从数据库中读取数据并使用 numpy 和 pandas 操作它们
- 使用 sklearn 进行聚类
- 将这些数据写入数据库
我想将此脚本包含在 .net 解决方案中,但我不知道从哪里开始。
一些可能性:
- 从解决方案中的 .net 模块调用脚本。不喜欢这样,因为我们需要在客户的服务器上部署解决方案,所以他们应该看不到脚本
- 创建一个可执行文件,该文件接受一些输入(例如 db 地址)并以某种方式(不知道如何)在“内部”解决方案。
有什么建议吗?
python - 尝试导入 sklearn 模块时出错:ImportError: DLL load failed: The specified module could not be found
我尝试为机器学习项目进行以下导入:
我收到此错误消息:
请帮助我尝试了一切,但没有任何效果。我也尝试了这些解决方案: ImportError: DLL load failed: Le module spécifié est introuvable
python - 导入整个模块与仅从 python 中的模块导入所需的方法有什么区别?
在使用 scikit learn 或其他类似的 Python 库时,这样做有什么区别:
和
使用一种方式比另一种方式有什么优势吗?
pandas - 当定义的掩码为真时如何更改特定列的值?
我有一个数据框,其中有这些列名
- '团队 1',
- '团队 2',
- '城市',
- '日期'。
我想要做的是在满足某些条件时将“城市”的值指定为“迪拜”(我使用掩码定义)。
这就是我正在做的事情:
当满足上述所有条件时,我想将“城市”(现在为空)中的值更改为“迪拜”
出现的问题:
“系列”对象是可变的,因此它们不能被散列
我怎样才能做到这一点?
python - 根据列将数据框分为两组
我有 Dataframe df
,我选择了一些数据框,我想根据名为 Sevrice 的库将它们分成 xtrain 和 xtest。这样原始的 1 和 o 进入 xtrain 和 nan 进入 xtest。
已编辑
我收到此错误logistic.predict(xtest)
python - 将 Numpy 数组映射到字符列表
给定一个两个昏暗的 numpy 数组:
和转换字典:
d = {-1:'a', 0:'b', 1:'c'}
如何将原始数组映射到字符组合列表?
我需要的是以下列表(或数组)
输出 = ['aa', 'ac', 'cc', 'cc', 'cb', 'ba', ....]
(我正在做一些机器学习分类,我的类由 -1、0,1 的组合标记,我需要将“标签”数组转换为可读的东西,如“aa”、“bc”等)。
如果sklearn 包中有一个简单的函数(binarizer,或者 one-hot-encoding),可以将原始的凹凸数组转换为一组标签,那就完美了!
python - statsmodel OLS和scikit线性回归的区别;不同的模型给出不同的r平方
我是 python 新手,并试图计算一个简单的线性回归。我的模型有一个因变量和一个自变量。我正在使用 sklearn 包中的 linear_model.LinearRegression() 。我得到了 0.16 的 R 平方值然后我使用 import statsmodels.api as sm mod = sm.OLS(Y_train,X_train) 得到了 0.61 的 R 平方值。下面是从大查询中获取数据的代码
我对此很陌生。试图了解我应该使用哪个线性回归包?
python - 如何使用 sklearn 的 CountVectorizer 进行矢量化和去矢量化?
我想将一些文本矢量化为相应的整数,然后将这些文本转换为其映射的整数,并使用新的输入整数创建新句子[2,9,39,46,56,12,89,9]
。
我已经看到了一些可以用于此目的的自定义功能,但我想知道 sklearn 本身是否具有此类功能。