问题标签 [fillna]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 熊猫:在每组中平均填充缺失值
这应该很简单,但我发现最接近的是这篇文章: pandas: Filling missing values within a group,我仍然无法解决我的问题....
假设我有以下数据框
我想在每个“名称”组中用平均值填写“NaN”,即
我不知道该去哪里:
谢谢一堆。
python - Python Pandas 将一列中的 NaN 替换为第二列对应行的值
我正在 Python 中使用这个 Pandas DataFrame。
我需要用Temp_Rating
列中的值替换列中的所有 NaN Farheit
。
这就是我需要的:
如果我进行布尔选择,我一次只能选择其中一列。问题是,如果我随后尝试加入他们,我将无法在保持正确顺序的同时做到这一点。
我怎样才能只找到Temp_Rating
带有NaN
s 的行并将它们替换为Farheit
列的同一行中的值?
python - 如何将另一整列作为参数传递给 pandas fillna()
我想使用fillna
方法用另一列中的值填充一列中的缺失值。
(我读到循环遍历每一行是非常糟糕的做法,一次做所有事情会更好,但我不知道如何用fillna
.)
之前的数据:
之后的数据:
python - 加速 xarray 的 fillna
我有一个相当大的 netCDF 文件(~10 GB),其填充值为 -1.0
当我像这样使用xarray的fillna时:
它很慢(约 2 分钟),是否有另一个可能更快的操作员?或者,考虑到文件的大小,这是可以预料的?
python - 如何在 Pandas 中有条件地找到 NaN
我正在使用 2 个字段 Outlet Type 进行基本数据探索:
出口尺寸:
我发现了一些如下见解:如果 Outlet_Type 是杂货店,它总是一个小的 Outlet_Size。
我想用这些信息来填写一些 Nan's in Outlet_size where Outlet_type = Grocery store。
有人可以帮助我,我该如何使用 Fillna 中的条件?
python - Pandas 具有 None 值的对象类型的最大长度
我编写了一个简短的函数来输出数据框中每一列的最大值(或字符串的最大长度),并针对各种数据类型进行调整。
它工作正常,但我只是想检查是否有更好的替代第 6 行的方法,使用 fillna,我需要它来处理 None 值。理想情况下,我会忽略 None,但我找不到使用类似 skipna=True 的方法。
如果我真的想我想我可以添加
在第 7 行之后返回 None 值,但这几乎不是任何人都会称之为 Pythonic...</p>
有没有人有更好的建议?
python - 熊猫仅替换列的一部分
这是我的输入:
产生这个输出:
我需要做的是将“C”列更改为一组三个连续的 1,不重叠。所需的输出是:
因此,第 2、3 和 6 行从 NaN 变为 1.0。第 7 行已经有一个 1.0,它被忽略了。第 8 行和第 9 行需要保持 NaN,因为第 7 行是前一组的最后一个条目。
我不知道是否有更好的方法来构建可以在创建时执行此操作的列“C”。
我尝试了几个版本的 fillna 和 ffill,没有一个对我有用。
看起来很复杂,但我尝试用这一行隔离每个 1.0 的行 ID:
哪个正确输出:
尽管我知道这些信息,但我不知道如何从那里着手。
非常感谢您提前提供的帮助,大卫
python - 如何使用列模式处理 Pandas fillna()?
我有一个数据集,其中有一个名为“Native Country”的列,其中包含大约 30000 条记录。有些缺少代表,NaN
所以我想用mode()
价值来填充它。我写了这样的东西:
但是,当我计算缺失值时:
它仍然NaN
为 Native Country 列提供相同数量的值。
python - Python pandas 数据框转换不带小数的值
在我的数据框中,我使用以下代码将 NaN 更改为 0
但是,我得到的值是“0.0”而不是“0”。我在这个数据框中有 >150 列,有些需要小数,而那些转换为 NaN 值的列必须没有小数。我怎么能得到那个。我的数据框例如如下:
我得到:
我只需要将“NaN”更改为“0”而不影响例如列 SCM/genes。不能选择使用带有列名的代码,因为我在这个数据框中有 >150 列带有 NaN。
谢谢
python - Pandas - 填充行子集
我正在尝试在某些条件适用的情况下用 0 填充一些行。我正在努力:
这不起作用 bc IndexingError: Unalignable boolean Series key provided
,但是当我尝试时
这注册为更新副本。我怎样才能做到这一点?谢谢!