“describe”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

762 浏览

hive - Hive - 如何从“描述表”中获取结果到临时表或 cte

我试图在一堆蜂巢表上运行描述，并想创建一堆 cte，然后将它们联合起来。像这样的东西：

不幸的是，当我尝试这样做时出现此错误：

关于如何做到这一点的任何建议？

2018-01-25T16:11:03.907

0 投票

0 回答

136 浏览

amazon-redshift - Redshift 中的“显示创建表”

我试过搜索这个，但是在 Redshift 中执行“Show CREATE TABLE”语句的最简单方法是什么？

我尝试了以下方法：

我也尝试过查询svv_table_info但我没有看到任何我的表在结果中正确显示。例如，如果我创建了一个新表，当我对它运行 select * 时，我希望它会显示在系统表上，但我没有找到它......

本质上，我正在尝试验证排序键是否在表上正确实施。我正在通过 jdbc 连接上的 dbvisualizer 连接到我的 redshift 数据库。

任何帮助将不胜感激！

amazon-redshift create-table describe

2018-02-07T15:37:46.487

0 投票

2 回答

10519 浏览

python - 如何将列描述为分类值？

我有一个熊猫数据框，其中包含分类列和数字列的混合。默认情况下，df.describe()仅返回数值数据的摘要（用count, mean, std, min, quantiles,描述这些列max）

当遍历 df 中的所有列并单独描述它们时，因为[df[c].describe() for c in df.columns] 描述是基于特定列 dtype 返回的；即数字摘要int和float分类摘要object

有谁知道用count, unique, top,将所有列描述为分类的简洁方法freq？

python pandas dataframe describe

2018-02-26T21:46:57.277

0 投票

3 回答

740 浏览

pandas - std() groupby 熊猫问题

这可能是一个错误吗？当我对 groupby 对象使用 describe() 或 std() 时，我得到了不同的答案

pandas dataframe std pandas-groupby describe

2018-03-22T04:14:19.170

0 投票

1 回答

1210 浏览

python - 如何在一个语句中说明 Python-Pandas describe() 表？

我试图分析一组数据集。但是，我找不到有效展示的方法。我想也许groupby()可以解决它，但我打算一次显示所有表格，我不知道应该如何说明它。我的另一个解决方案是在比较中显示每一列；第一，第二，然后第三。这是我主要想要实现的，例如：

这是我的另一个解决方案（可能不好）：

任何建议或解决方案都会有所帮助。代码：

输出：

python pandas describe

2018-03-31T22:20:33.757

0 投票

1 回答

3202 浏览

python - 在 Python Pandas 模块中描述函数

我正在尝试为 Apple 和 Alphabet 的股票收益创建汇总统计数据。我已经有了包含所有信息的 excel 文件和下面的（小）代码：

但是，当我运行它时，它会返回“count、unique、top 和 freq”而不是“mean、min、max 等”。有人可以解释我如何解决这个问题吗？以及如何仅获得一个特定列的平均值、最小值、最大值等？

谢谢！

python pandas describe

2018-04-25T17:05:01.633

0 投票

1 回答

132 浏览

javascript - 如何在使用 ng-test 进行单元测试期间检查是否从未调用 fdescribe() 和 fit()？

简单的场景、角度、单元测试和持续部署。可能发生的情况是开发人员完成了与组件相关的单元测试。在开发期间，开发人员使用这些功能fdescribe()或fit()只是为了运行那些特定的测试。

在分心的时刻，开发人员提交、推送和部署是在生产中完成的，但fdescribe()或者fit()被遗忘在代码中。

测试没有失败，但这带来了一个糟糕的场景，基本上所有的常规测试都没有运行，但是红绿灯说 GO 并且所有部署都完成了。

是否可以检查在所有单元测试中是否调用了任何fdescribe()或被fit()调用？

javascript angular unit-testing deployment describe

2018-04-30T11:40:18.210

0 投票

5 回答

51428 浏览

python - Python Dataframes：描述单列

有没有一种方法可以将 df.describe() 应用于 DataFrame 中的一个独立列。

例如，如果我有几列并且我使用 df.describe() - 它会返回并描述所有列。根据研究，我知道我可以添加以下内容：

“dtypes 的类似列表：将结果限制为提供的数据类型。要将结果限制为数字类型，请提交 numpy.number。要将其限制为对象列，请提交 numpy.object 数据类型。字符串也可用于select_dtypes 的样式（例如 df.describe(include=['O'])）。要选择 pandas 分类列，请使用 'category'"

但是我不太清楚如何用python代码写出来。提前致谢。

python dataframe describe

2018-05-04T01:38:48.570

0 投票

1 回答

1472 浏览

python - 使用描述获取 Pandas 中有序分类数据的最小值和最大值？

我有一个数字和分类数据的混合 Pandas 数据框。我订购了分类数据，我可以使用 min() 和 max() 函数获取最小值和最大值，但无法使用 describe 函数获取它们。有没有办法将 describe 函数与有序分类数据一起使用并获取最小值和最大值？

代码：

输出：

python pandas categorical-data describe

2018-05-08T15:31:45.520

0 投票

2 回答

422 浏览

r - R：使用观察次数删除变量

我有一个大型数据集，我试图根据每个变量有多少观察来删除我的一些变量。例如，我想在我的数据框中删除 n < 3 的任何变量（该变量的总观察值小于 3）。由于 R 可以使用 describe 计算每个变量的观察值，我不能使用该数字来对数据进行子集化，而不是每次我拉入新版本时都必须输入每个变量名称（每个版本都有不同的变量，这些变量的 n 值较低并且有超过40个变量）。非常感谢你的帮助！

例如，我的数据如下所示：

我希望能够根据它们的 n 分别为 0 和 1 来放弃“激进”和“伤害”。但是，与其告诉 R 用变量名删除它们，不如告诉 R 将任何变量放在哪里n < 3（或我选择的任何数字）会更方便，因为我将在多个版本中使用此代码这个数据集。我尝试过使用列号（这比写出来要好），但是当我必须处理describe()数据时，找出哪些变量的 n 值较低，然后删除 28 个变量或subset()围绕它们，这仍然很乏味。这可行，但它很麻烦......

出于某种原因，我的示例在编辑和保存时看起来不同，因此我还包含了它的图像。对不起。这是我第一次使用堆栈溢出来提问。实际上，我花了很多时间在谷歌上搜索，但找不到与 n 相关的答案。

此行无效：DF[, sapply(DF, function(col) length(na.omit(col))) > 4]

r subset describe

2018-06-14T07:19:46.857

问题标签 [describe]

Reference