问题标签 [describe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hive - Hive - 如何从“描述表”中获取结果到临时表或 cte
我试图在一堆蜂巢表上运行描述,并想创建一堆 cte,然后将它们联合起来。像这样的东西:
不幸的是,当我尝试这样做时出现此错误:
关于如何做到这一点的任何建议?
amazon-redshift - Redshift 中的“显示创建表”
我试过搜索这个,但是在 Redshift 中执行“Show CREATE TABLE”语句的最简单方法是什么?
我尝试了以下方法:
我也尝试过查询svv_table_info但我没有看到任何我的表在结果中正确显示。例如,如果我创建了一个新表,当我对它运行 select * 时,我希望它会显示在系统表上,但我没有找到它......
本质上,我正在尝试验证排序键是否在表上正确实施。我正在通过 jdbc 连接上的 dbvisualizer 连接到我的 redshift 数据库。
任何帮助将不胜感激!
python - 如何将列描述为分类值?
我有一个熊猫数据框,其中包含分类列和数字列的混合。默认情况下,df.describe()
仅返回数值数据的摘要(用count
, mean
, std
, min
, quantiles
,描述这些列max
)
当遍历 df 中的所有列并单独描述它们时,因为[df[c].describe() for c in df.columns]
描述是基于特定列 dtype 返回的;即数字摘要int
和float
分类摘要object
有谁知道用count
, unique
, top
,将所有列描述为分类的简洁方法freq
?
pandas - std() groupby 熊猫问题
这可能是一个错误吗?当我对 groupby 对象使用 describe() 或 std() 时,我得到了不同的答案
python - 如何在一个语句中说明 Python-Pandas describe() 表?
我试图分析一组数据集。但是,我找不到有效展示的方法。我想也许groupby()
可以解决它,但我打算一次显示所有表格,我不知道应该如何说明它。我的另一个解决方案是在比较中显示每一列;第一,第二,然后第三。这是我主要想要实现的,例如:
这是我的另一个解决方案(可能不好):
任何建议或解决方案都会有所帮助。代码:
输出:
python - 在 Python Pandas 模块中描述函数
我正在尝试为 Apple 和 Alphabet 的股票收益创建汇总统计数据。我已经有了包含所有信息的 excel 文件和下面的(小)代码:
但是,当我运行它时,它会返回“count、unique、top 和 freq”而不是“mean、min、max 等”。有人可以解释我如何解决这个问题吗?以及如何仅获得一个特定列的平均值、最小值、最大值等?
谢谢!
javascript - 如何在使用 ng-test 进行单元测试期间检查是否从未调用 fdescribe() 和 fit()?
简单的场景、角度、单元测试和持续部署。可能发生的情况是开发人员完成了与组件相关的单元测试。在开发期间,开发人员使用这些功能fdescribe()
或fit()
只是为了运行那些特定的测试。
在分心的时刻,开发人员提交、推送和部署是在生产中完成的,但fdescribe()
或者fit()
被遗忘在代码中。
测试没有失败,但这带来了一个糟糕的场景,基本上所有的常规测试都没有运行,但是红绿灯说 GO 并且所有部署都完成了。
是否可以检查在所有单元测试中是否调用了任何fdescribe()
或被fit()
调用?
python - Python Dataframes:描述单列
有没有一种方法可以将 df.describe() 应用于 DataFrame 中的一个独立列。
例如,如果我有几列并且我使用 df.describe() - 它会返回并描述所有列。根据研究,我知道我可以添加以下内容:
“dtypes 的类似列表:将结果限制为提供的数据类型。要将结果限制为数字类型,请提交 numpy.number。要将其限制为对象列,请提交 numpy.object 数据类型。字符串也可用于select_dtypes 的样式(例如 df.describe(include=['O']))。要选择 pandas 分类列,请使用 'category'"
但是我不太清楚如何用python代码写出来。提前致谢。
python - 使用描述获取 Pandas 中有序分类数据的最小值和最大值?
我有一个数字和分类数据的混合 Pandas 数据框。我订购了分类数据,我可以使用 min() 和 max() 函数获取最小值和最大值,但无法使用 describe 函数获取它们。有没有办法将 describe 函数与有序分类数据一起使用并获取最小值和最大值?
代码:
输出:
r - R:使用观察次数删除变量
我有一个大型数据集,我试图根据每个变量有多少观察来删除我的一些变量。例如,我想在我的数据框中删除 n < 3 的任何变量(该变量的总观察值小于 3)。由于 R 可以使用 describe 计算每个变量的观察值,我不能使用该数字来对数据进行子集化,而不是每次我拉入新版本时都必须输入每个变量名称(每个版本都有不同的变量,这些变量的 n 值较低并且有超过40个变量)。非常感谢你的帮助!
例如,我的数据如下所示:
我希望能够根据它们的 n 分别为 0 和 1 来放弃“激进”和“伤害”。但是,与其告诉 R 用变量名删除它们,不如告诉 R 将任何变量放在哪里n < 3
(或我选择的任何数字)会更方便,因为我将在多个版本中使用此代码这个数据集。我尝试过使用列号(这比写出来要好),但是当我必须处理describe()
数据时,找出哪些变量的 n 值较低,然后删除 28 个变量或subset()
围绕它们,这仍然很乏味。这可行,但它很麻烦......
出于某种原因,我的示例在编辑和保存时看起来不同,因此我还包含了它的图像。对不起。这是我第一次使用堆栈溢出来提问。实际上,我花了很多时间在谷歌上搜索,但找不到与 n 相关的答案。
此行无效:DF[, sapply(DF, function(col) length(na.omit(col))) > 4]