问题标签 [fillna]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何将 numpy fillna() 和 numpy.where() 用于 pandas DataFrame 中的列?
这是一个示例熊猫数据框:
我正在end
使用以下方法定义一个新列numpy.where()
:
如果列部分存在,我想使用相同的方法来填充NaN
值,例如这里是a确实作为列存在的地方,但有很多end
DataFrame
end
NaN
值。(编辑:这些不是 NA 的值可能是完全唯一的):
我认为可以使用 来执行此操作pandas.DataFrame.fillna()
,但这会引发错误:
问题:我如何有效地np.where()
仅使用NaN
特定列中的值?
python-3.x - 如何用前 n 行的平均值或中位数填充 NA?
我有一个时间序列数据集,在某些行上显示 NA。我想根据前 n 天(行)的平均值或中位数填充这些 NA。为此,我创建了具有滚动平均值的新列。但是,我正在寻找一种不创建新列的方法(使用应用功能?)。
这是我的方式:
pandas - 熊猫有效的空值
我正在寻找 pandas fillna() 方法将替换的有效空值列表,例如“NaN”、“NA”、“NULL”、“NaT”。我在文档中找不到它。
python - 大熊猫的条件前向填充
我有一个数据框:
我想根据代码列在 Q 列中填写 nans。例如,索引为 30 的行中的代码与第 36 行中的代码相同,所以我想将相同的 Q 放在那里。
我目前正在按照以下方式进行操作,有没有更好的方法?
python - 用于在数据帧中替换 NaN 的 fillna 函数,提高 IOPub 数据速率超出
Python 新手,通过 Panda 导入和清理工作。
我的代码:
错误:
IOPub data rate exceeded 笔记本服务器将暂时停止向客户端发送输出以避免崩溃。要更改此限制,请设置配置变量
--NotebookApp.iopub_data_rate_limit
。
我C:\Users\pelucas\.jupyter\ jupyter_notebook_config
从
至
同样的错误
我修改了fillna
命令以df.iloc[0:1500,0:33].fillna(value=0,inplace=true)
查看它是否有效,它确实有效,但是一旦我发现df.iloc[0:1600,0:33]
上面的错误再次出现。
该fillna
函数在 Jupyter Notebook中显示其操作的结果,我猜这是问题所在。
- 有没有办法强制 Jupyter 不显示 fillna 命令的结果?或者如果它必须只显示纯文本?
- 我导入了 33 列 (0:33) 但我的 fillna 命令有 0:33 暗示 34 个列或者零元素是内部索引?
- 我的 read_csv 看起来有点长,我可以缩写列号,即 0:33 吗?
python-3.x - Pandas Dataframe 对 fillna 的限制尚未实施
我想fillna
在 pandas 数据帧上实现method='bfill'
一个方法limit
但我有以下错误
我在这个讨论中发现存在一个错误,但从那以后我没有找到另一个答案。 https://github.com/pandas-dev/pandas/issues/1892
我使用了关键字method
,但它仍然不起作用
pandas.Series/DataFrame.fillna 限制中的错误?
谢谢你。
最好的,
python - 熊猫 groupby 没有按预期工作
我有一个数据框:
虽然我在上面只显示了 2 个日期,但它有很多日期。每个日期都有几个“代码”的条目。给定日期的每个代码都有 2 个条目 - 一个用于符号 C,一个用于 P。如果我有 C 或 P 的 M1/M2 条目,我想用该代码/天的那个填充“nan”。如果对于给定的代码+天,C 和 P 都是 nan,我将其保留为 nan。
我目前这样做如下:
这有效,但需要很长时间。这是上面 df 的输出:
为了让它更快,我尝试了以下方法:
这不能按预期工作(因为上面的代码有效)。似乎我们只按日期分组而不是“代码”分组。这是输出:
有什么方法可以加快上面的代码,或者对为什么第二个代码不起作用有任何见解。
pandas - 熊猫:用 groupby 填充整个 df
我有以下带有更多数字列的df。我现在想对数据框中的所有列进行前向填充,但按 id 分组。
结果应如下所示:
我尝试了以下命令:
但是,这会引发 KeyError “isin”。使用以下命令仅填充一列就可以了,但是如何有效地向前填充按 isin 分组的整个 df?
python - Panda - Fillna - TypeError:无法使用空键标记索引
我正在尝试使用具有一些 NaN 值的 Pandas DataFrame。当我尝试
我收到以下错误,找不到解决方案或原因:错误:
所有列都是 int 或 float。我什至能够将单列提取到一个数组中,在这个数组上执行 fillna() 并重新集成到 DataFrame 中。
任何想法或提示?非常感谢!
我的代码:
我正在处理的文件来自 Kaggle the test 或 train.csv。我对这两个数据都有相同的错误: https ://www.kaggle.com/c/house-prices-advanced-regression-techniques/data
错误代码是这样的:
pandas - 熊猫用 nan 值更新特定行
我一直在浏览,但找不到我的特定问题的答案。
我有一个包含数百列和数百行的数据框。我只想更改第一行出现的 NaN 值并将它们替换为空字符串。已针对更改列或整个数据框而不是特定行来回答此问题。我也不想修改其他行中出现的 NaN。
我尝试了以下方法:
我也尝试过:
但是当我调用数据框时,它没有被修改。任何帮助将不胜感激!