获取数据帧(或列表或数组)中任何列的简单描述性统计信息的最佳方法是什么,无论是否嵌套,一种高级 df.describe() 还包括具有数值的嵌套结构。
就我而言,我有一个包含许多列的数据框。有些列的每一行都有一个数字列表(在我的例子中是一个时间序列结构),这是一个嵌套结构。
这种嵌套结构意味着:
- 数组列表,
- 数组数组,
- 一系列列表,
- 在某些列中具有嵌套数值列表的数据框(我的情况)
如何一次性从任何级别的嵌套结构中获取简单的描述性统计数据?
要求
df.describe()
只会给我数字列的统计信息,但不会给我包含数值列表的列的统计信息。我无法仅通过应用获得统计信息
from scipy import stats
stats.describe(arr)
或者因为它是如何获得 NumPy 数组的描述性统计数据中的解决方案?对于非嵌套数组。