问题标签 [fillna]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 用平均值填充空值
我得到了一个包含许多 NaN 值的数据集,我想用每列的平均值填充空值。所以我尝试了以下代码:
但我收到此错误:
我要填充的列都是由相同的类型组成的:要么是“float64”,要么是“O”。
我怀疑问题源于这个事实,但我该如何解决呢?
编辑:我创建了一个包含列的字典,该列包含缺少某些数据的列的索引和每列的类型。
如果我运行 fill_mean(),现在我得到一个不同的错误:
python - 当数据框中的 None 和 NaN 值时与 fillna() 混淆
当我申请以下内容时fillna('New_Value)
,df
它会填充除at之外的所有None
andNaN
值。Column:D
Index 1
那么是什么原因呢?
这是我的代码
python-3.x - 需要在python中的na值之前用过去三个值填充NA值
需要用该 NA 的过去三个值的平均值填充 NA 值
这是我的数据集
RECEIPT_MONTH_YEAR NET_SALES
0 2014-01-01 818817.20
1 2014-02-01 362377.20
2 2014-03-01 374644.60
3 2014-04-01 不适用
4 2014-05-01 不适用
5 2014-06-01 不适用
6 2014-07-01 不适用
7 2014-08-01 46382.50
8 2014-09-01 55933.70
9 2014-10-01 292303.40
10 2014-10-01 382928.60
python - 仅在 PANDAS 中的某些列上使用 to_numeric
我有一个包含 15 列的数据框。其中 5 列使用数字,但有些条目是空白或单词。我想将它们转换为零。
我能够将其中一列中的条目转换为零,但是当我尝试对多列执行此操作时,我无法做到。我为一列尝试了这个:
它有效,但是当我对多个列尝试此操作时:
我收到错误:arg 必须是列表、元组、一维数组或系列
我认为这是我调用要修复的列的方式。我是熊猫的新手,所以任何帮助将不胜感激。谢谢
python - 熊猫仅在具有至少 1 个非 NaN 值的行上填充
假设我有一个这样构造的 DataFrame:
看起来像这样:
我想过滤到至少有 1 个 non-NaN value的列,然后 fillna 就位。
如果我执行以下操作:
这将创建一个新的 DataFrame,该 DataFrame 具有正确填充的值,并删除了全为 NaN 的行。
但我想保留所有 NaN 行,所以我尝试将其应用到位:
但对原始 DataFrame 没有任何更改 - 我做错了什么?
python - 引入条件时无法使用 fillna - SyntaxError: invalid syntax
给定以下数据框:
我需要用 np.nan 替换列 B 中小于 0 的所有值(例如);我试过了:
但它给了我以下错误:
python - Pandas backfill specific value
I have dataframe as such:
For each name
i want to backfill the prior 3 na spots with -1 so that I end up with
Note there can be multiple sections with NaN. If a section has less than 3 nans it will fill all of them (it backfills all up to 3).
python - 用来自另一个 DataFrame 熊猫的随机值填充 nan 值
我有一个包含数百万行和很多 NaN 值的 DataFrame。一些例子:
我的想法是用其 Area 的 2 个最常见值之一填充 Companies NaN 值。
例如:如果技术领域最常见的公司是 Apple 和 Google,我想用其中一个值(随机)填充“df['Area'] == 'Technology'”NaN 值
我已经用最常见的值创建了一个 Group By DataFrame,它是这样的:
结果应该是这样的:
我希望你能帮助我。
谢谢!!!