问题标签 [drop]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 从 pandas DataFrame 中删除包含空单元格的行
我有一个pd.DataFrame
通过解析一些 excel 电子表格创建的。其中有一列有空单元格。例如,下面是该列频率的输出,32320 条记录缺少Tenant的值。
我正在尝试删除租户丢失的行,但是.isnull()
选项无法识别丢失的值。
该列的数据类型为“对象”。在这种情况下发生了什么?如何删除租户丢失的记录?
python - Pandas:垃圾收集丢弃的列以释放内存
我正在处理一个包含大约 20,000,000 行和 4 列的大型数据集。不幸的是,我机器上的可用内存(~16GB)是不够的。
示例(时间是从午夜开始的秒数):
然后我将数据集转换为适当的时间序列对象:
为了释放内存,我想删除多余的日期和时间列。我用.drop()
方法做,但内存没有释放。之后我也尝试打电话gc.collect()
,但这也无济于事。
这是我调用来处理所描述的操作的代码。del
零件释放内存但不释放drop
零件。
如何从 pandas 数据框中释放内存?
python - 从数据框中删除第一行
我有一个看起来像这样的数据框:
我试图摆脱顶行,只保留
我试过df.columns.droplevel(0)
但没有成功任何帮助都非常受欢迎
hadoop - 在 Apache Hive 中,具有大量外部表的数据库需要很长时间才能 DROP CASCADE
我找到了很多关于如何删除数据库及其所有表的答案,但没有任何关于为什么每个表需要约 3-4 秒才能删除的答案,似乎是在 SERIAL 中(一个接一个)。
我有一个数据库,其中有 2,414 个外部表指向镶木地板位置,并且DROP DATABASE <db> CASCADE;
可能需要 1-2 小时才能删除数据库的元数据。
在一个单独的会话中,我可以反复SHOW TABLES IN <deleted DB>;
观察桌子的数量以每 3-4 秒大约 1 个的速度下降。在会话释放删除之前这需要 2 小时以上,并允许我们用新数据库替换数据库......
是什么让 Hive 花了这么长时间?有没有我可以用来让它更快的配置?有没有办法告诉我在那段时间它在做什么?
如果它更常见,我认为其他人会遇到这个问题,所以这让我觉得我有一个设置可以调整来解决这个问题(?)......
在删除的数据库下似乎没有删除镶木地板,因此它似乎与 hdfs/parquet 文件没有任何关系,除非出于任何原因删除外部表检查它们...
任何想法为什么它会这么慢?
dataframe - 根据两列或多列中的条件删除行
我是编程新手,所以请原谅我的无知。
我有以下数据框:
我的意图是删除那些重复 ID 的行(即行 0-1 或 309-311)并且行中有相同的名称。
我尝试了很多事情,例如使用带有移位列的迭代和条件,但我担心在迭代时不可能删除多行。
我只显示了可以找到条件的两列,但可能还有更多(即如果列 ['age'] >= 20:删除行)。
感谢您的帮助先生和女士们。
image - 将图像从表格单元格拖动到 iFrame 可放置区域
我无法将图像从动态表中的一个 iframe (1) 拖动到可放置区域内的另一个 iframe (2)。我认为没有权限问题,而是“类型”问题。iframe (2) 上的放置区域正在处理来自除 iframe (1) 之外的任何地方的文件。iframe (1) 由 localhost 托管。iframe (2) 由不同的域托管。测试了我发现将数据 uri 转换为文件或 blob 的三个不同函数。setData 参数也已经过各种可能性的测试,目前还没有成功。有趣的是,在 Chrome 和 firefox 上用两个 iframe 打开网站后,我可以将一个 drop 从 firefox 拖放到 Chrome,但图像将被转换为 bmp 类型并重命名!另一种方法是行不通的。
- setData / get Data 将图像数据 uri 拖放到拖放区域的正确参数是什么?
- 我是否必须将数据 uri 转换为文件。斑点对象?
- 如果是这样,再次,什么论据可以完成这项工作?
任何帮助将不胜感激!
python - 在 Pandas 中用列切片删除 NaN 行
我在 DataFrame 中有数百列,并且想删除多列为 NaN 的行。意思是这些列的整行都是 NaN。
我试图对列进行切片,但代码需要永远运行。
感谢任何帮助。
python - 从 xarray 数据集中删除一个坐标值
我有包含以下信息的 xarray 数据集:
现在我想从变量 tas 中删除一个月的数据,我尝试了很多方法但我无法做到:预期形状
这是我的方法:
我知道这可能是一个简单的解决方案,但我找不到它。请帮我解决一下这个。
更新整个数据集
data.tas = data.tas.where(data.tas.time!=cftime.DatetimeNoLeap(1,1,15,12,0,0), drop=True)
我认为这会更新整个数据集,但它给了我错误。