问题标签 [describe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
762 浏览

hive - Hive - 如何从“描述表”中获取结果到临时表或 cte

我试图在一堆蜂巢表上运行描述,并想创建一堆 cte,然后将它们联合起来。像这样的东西:

不幸的是,当我尝试这样做时出现此错误:

关于如何做到这一点的任何建议?

0 投票
0 回答
136 浏览

amazon-redshift - Redshift 中的“显示创建表”

我试过搜索这个,但是在 Redshift 中执行“Show CREATE TABLE”语句的最简单方法是什么?

我尝试了以下方法:

我也尝试过查询svv_table_info但我没有看到任何我的表在结果中正确显示。例如,如果我创建了一个新表,当我对它运行 select * 时,我希望它会显示在系统表上,但我没有找到它......

本质上,我正在尝试验证排序键是否在表上正确实施。我正在通过 jdbc 连接上的 dbvisualizer 连接到我的 redshift 数据库。

任何帮助将不胜感激!

0 投票
2 回答
10519 浏览

python - 如何将列描述为分类值?

我有一个熊猫数据框,其中包含分类列和数字列的混合。默认情况下,df.describe()仅返回数值数据的摘要(用count, mean, std, min, quantiles,描述这些列max

当遍历 df 中的所有列并单独描述它们时,因为[df[c].describe() for c in df.columns] 描述是基于特定列 dtype 返回的;即数字摘要intfloat分类摘要object

有谁知道用count, unique, top,将所有列描述为分类的简洁方法freq

0 投票
3 回答
740 浏览

pandas - std() groupby 熊猫问题

这可能是一个错误吗?当我对 groupby 对象使用 describe() 或 std() 时,我得到了不同的答案

0 投票
1 回答
1210 浏览

python - 如何在一个语句中说明 Python-Pandas describe() 表?

我试图分析一组数据集。但是,我找不到有效展示的方法。我想也许groupby()可以解决它,但我打算一次显示所有表格,我不知道应该如何说明它。我的另一个解决方案是在比较中显示每一列;第一,第二,然后第三。这是我主要想要实现的,例如:

这是我的另一个解决方案(可能不好):

任何建议或解决方案都会有所帮助。代码:

输出:

0 投票
1 回答
3202 浏览

python - 在 Python Pandas 模块中描述函数

我正在尝试为 Apple 和 Alphabet 的股票收益创建汇总统计数据。我已经有了包含所有信息的 excel 文件和下面的(小)代码:

但是,当我运行它时,它会返回“count、unique、top 和 freq”而不是“mean、min、max 等”。有人可以解释我如何解决这个问题吗?以及如何仅获得一个特定列的平均值、最小值、最大值等?

谢谢!

0 投票
1 回答
132 浏览

javascript - 如何在使用 ng-test 进行单元测试期间检查是否从未调用 fdescribe() 和 fit()?

简单的场景、角度、单元测试和持续部署。可能发生的情况是开发人员完成了与组件相关的单元测试。在开发期间,开发人员使用这些功能fdescribe()fit()只是为了运行那些特定的测试。

在分心的时刻,开发人员提交、推送和部署是在生产中完成的,但fdescribe()或者fit()被遗忘在代码中。

测试没有失败,但这带来了一个糟糕的场景,基本上所有的常规测试都没有运行,但是红绿灯说 GO 并且所有部署都完成了。

是否可以检查在所有单元测试中是否调用了任何fdescribe()或被fit()调用?

0 投票
5 回答
51428 浏览

python - Python Dataframes:描述单列

有没有一种方法可以将 df.describe() 应用于 DataFrame 中的一个独立列。

例如,如果我有几列并且我使用 df.describe() - 它会返回并描述所有列。根据研究,我知道我可以添加以下内容:

“dtypes 的类似列表:将结果限制为提供的数据类型。要将结果限制为数字类型,请提交 numpy.number。要将其限制为对象列,请提交 numpy.object 数据类型。字符串也可用于select_dtypes 的样式(例如 df.describe(include=['O']))。要选择 pandas 分类列,请使用 'category'"

但是我不太清楚如何用python代码写出来。提前致谢。

0 投票
1 回答
1472 浏览

python - 使用描述获取 Pandas 中有序分类数据的最小值和最大值?

我有一个数字和分类数据的混合 Pandas 数据框。我订购了分类数据,我可以使用 min() 和 max() 函数获取最小值和最大值,但无法使用 describe 函数获取它们。有没有办法将 describe 函数与有序分类数据一起使用并获取最小值和最大值?

代码:

输出:

0 投票
2 回答
422 浏览

r - R:使用观察次数删除变量

我有一个大型数据集,我试图根据每个变量有多少观察来删除我的一些变量。例如,我想在我的数据框中删除 n < 3 的任何变量(该变量的总观察值小于 3)。由于 R 可以使用 describe 计算每个变量的观察值,我不能使用该数字来对数据进行子集化,而不是每次我拉入新版本时都必须输入每个变量名称(每个版本都有不同的变量,这些变量的 n 值较低并且有超过40个变量)。非常感谢你的帮助!

例如,我的数据如下所示:

我希望能够根据它们的 n 分别为 0 和 1 来放弃“激进”和“伤害”。但是,与其告诉 R 用变量名删除它们,不如告诉 R 将任何变量放在哪里n < 3(或我选择的任何数字)会更方便,因为我将在多个版本中使用此代码这个数据集。我尝试过使用列号(这比写出来要好),但是当我必须处理describe()数据时,找出哪些变量的 n 值较低,然后删除 28 个变量或subset()围绕它们,这仍然很乏味。这可行,但它很麻烦......

出于某种原因,我的示例在编辑和保存时看起来不同,因此我还包含了它的图像。对不起。这是我第一次使用堆栈溢出来提问。实际上,我花了很多时间在谷歌上搜索,但找不到与 n 相关的答案。

此行无效:DF[, sapply(DF, function(col) length(na.omit(col))) > 4]