问题标签 [fillna]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
76 浏览

python - 使用三重索引填充数据框中的日期

我知道已经提出了与此问题类似的问题,但是当您只有一个分类变量时,该解决方案有效。我有两个,MultiIndexes我一直很难相处。问题是,我有以下数据框:

所以我需要知道每个日期有和没有电子商务的销售额,并填写没有出现零销售额的日期。我想要的输出是:

注意:这只是一个DataFrame,我只是添加了空格来区分索引。

因此,在原始数据框中,产品 A 的电子商务销售缺少 12-11 和 12-14,产品 A 的非电子商务销售缺少 12-13 和 12-14,产品 B 的电子商务销售缺少 12-12

问题是,我设法通过一个非常低效的循环来实现我想要的,这个循环需要大约 25 分钟才能运行:

我非常有信心我可以以矢量化的方式做到这一点,这应该花费更少的时间(我有 2,300 种产品,用于 290 个可能的日期)。你知道我怎样才能做到这一点吗?

编辑:添加了粗体文本,更好地解释了问题

0 投票
1 回答
749 浏览

python - 如何将 pandas 列中的值(之前为零)填充为来自下一行的正确整数/浮点值?

我一直在使用经纬度数据处理大型数据集。我正在为整个 df 进行插值,所以在此之前我只希望我的纬度和经度列有元素填充不带零的值。

我的数据框(解释目的):

我的要求:

我需要什么

我希望您从实际的 df 和我的要求中理解。

我只想取下一个具有除零以外的正确值的最后一个元素,并在该列的前几行中填充该元素。

要求

我相信会有一些不错的方法来完成我的工作。

0 投票
2 回答
63 浏览

python - 具有 Series 输入的类别列的 fillna 无法按预期工作

我有一个类别列,我想用一个系列来填充。我试过这个:

预期输出:

实际输出:

0 投票
1 回答
123 浏览

pandas - 如果熊猫中的NaN,如何将1添加到以前的数据

我想知道是否可以将 1(或 n)添加到 pandas DataFrame / Series 中的缺失值。

例如 :
1
10

15
25


30

将返回:
1
10
11
15
25
26
27
28
30

谢谢,

0 投票
0 回答
84 浏览

mode - 如何在按数据帧分组后按模式使用变换功能来填充

我有一个大数据集,例如:

  • 0 9:38:32 PM 1395/09/21 18 70.0 15.0 605.0 1395/09/22 150.2900
  • 1 晚上 9:38:33 1395/05/01 18 10.0 70.0 2250.0 1395/05/05 54.9180
  • 2 晚上 9:38:33 1396/10/08 2 3.0 70.0 2230.0 1396/10/09 72.2296
  • 3 下午 9:38:33 1395/04/07 18 75.0 70.0 2200.0 1395/04/11 67.8452
  • 4 下午 9:38:33 1395/04/07 18 75.0 70.0 2200.0 1395/04/11 89.4056
  • 5 下午 9:38:33 1396/05/23 9 70.0 49.0 2000.0 1396/05/26 99.4400

机票销售交易 我想按其他列的每个组的模式填充空值(“FROM”col 为“FROM2”列)。我可以像这样使用中位数:

如何使用模式而不是中位数

0 投票
1 回答
336 浏览

dataframe - 应用后的 Dask DataFrame 无法从重复轴重新索引

我正在尝试将 item_price 的 nan 值更改为基于以下 dask 数据框中的 item_id 的平均值:

不幸的是,我收到以下错误:

知道如何避免此错误或以任何其他方式将 nan 值更改为 dask 数据帧的平均值吗?

0 投票
2 回答
376 浏览

pandas - 通过查找到另一个 df 通过 pandas 在 df 的 1 列中填充 NaN

我看到了这个问题的各种版本,但它们似乎都不适合我正在尝试做的事情:这是我的数据:

这是带有 s 的 df NaN

接下来我有一个名为 df 的查找df2

我想通过查找列并返回来填充列的NaNs,以使结果如下所示:Adfdf2.Bdf2.Adfr

重要警告:

  1. dfs 没有匹配的索引
  2. df.A和的内容df2.A是非唯一的()
  3. do的行df2组成了唯一的对。
  4. 假设有更多列,未显示,NaNs。

df使用 pandas,可以通过以下方式找到(我认为)感兴趣的行: df.loc[df['A'].isnull(),]这个答案似乎很有希望,但我不清楚df1该示例的来源。我的实际数据集比这大得多,我将不得不以这种方式替换几列。

0 投票
1 回答
397 浏览

python - 用一个简单的函数填充 DataFrame

我正在寻找一种使用简单函数填充 DatFrame 的 NAs 值的方法:[row-1].value +1。数据帧的特殊性在于它有一个接一个的多个NA。

这是我正在处理的那种 DataFrame 的示例:

这是我想获得的输出:

0 投票
1 回答
130 浏览

python - Iterrows 不保留填充物

我想用一个可以从线性回归方程计算的值填充 DataFrame 中的一些 NaN 值。由于并非 DataFrame 中的所有值都是 NaN,因此我决定对其进行循环。这是数据框:

这是相应地填充 NaN 值的循环

我想知道为什么我的 DataFrame 在执行循环后保持不变。提前致谢。

0 投票
1 回答
266 浏览

python - Python将NAN更改为零向量

我有一个关于 Python 的问题。我使用构建一个段落向量doc2vec并将其转换为时间序列。所以我有一个索引,它是日期,然后是 8 家公司,并且每一天都有一个维度为 100 的向量,每个公司代表新闻文章。但是,有些日子没有返回NaN值的文章。现在我想将它们转换为维度为 100 的零向量。

我尝试使用以下代码片段来做到这一点:

但是,这不起作用,因为我无法用NaN列表或数组替换。有办法解决这个问题吗?

非常感谢你!