问题标签 [unnest]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
111 浏览

ms-access - MS-Access 中的未嵌套行?

目前,属性块和批次信息在单独的输入框中输入到我们的 ms-access 数据库中,然后填充表格。一盒用于块,一盒用于批次。如果应用程序包含一个块但多个批次,则用户输入以逗号分隔的批次信息。

像这样:

表格示例

最后的表很乱,无法正常查询。ms-access 中是否有办法让用户输入以逗号分隔的数据,但取消表中的行,以便每个块和批次都有自己的行?

像这样:

表后

0 投票
1 回答
63 浏览

sql - 在 Linux 中,不同的 SQL 不适用于 UNNEST

当我在窗口系统中运行此查询时,UNNSET 行为正确,但当我运行此查询时,Linux 行为不同。unnset 不同行上的重复记录列表

0 投票
0 回答
24 浏览

sql - POSTGRESQL - UNNEST 函数在 LINUX 中不起作用

我显示了重复的行。虽然我已经添加了'DISTINCT',但当我运行查询重复记录时显示。

这里有什么问题吗?

0 投票
1 回答
514 浏览

r - 从 R 中的弹性搜索结果中取消嵌套列表列表

编辑1:更简单的问题(对于整个问题,请查看原始编辑)

知道对的数量可能会有所不同,如何取消列出数据框中的键值对列表。

例如:

注意 (key1, key2, value1, value2) 是<data.frame>

预期结果:

我试过unnest, unlist,... 没有成功,因为由于元素的数量或对象的类,我总是出错。

原始编辑 我使用弹性包从搜索请求到弹性搜索库的结果。由于查询是来自预先存在的数据框中的术语的循环,因此我有一个每个术语的响应列表。

结果是这样的列表列表(为了清楚起见,我只显示第一个结果):

如您所见,第一个学期我有 2 个可能的结果:作家或电影,每个人都有一个类型和子类型的 {id,value} 列表。为了有一个更全面的视图,我重新排列输出:

结果,我有(仅限第一学期):

请注意,对于第二个结果(电影),我没有任何子类型。此外,类型或子类型中列出的元素的长度可能会根据搜索词而有所不同。

现在,我想取消嵌套列表以获得这样的数据框(抱歉,格式不是很全面,但基本上的想法是将每个 {key,value} 取消嵌套在 2 列中,并具有增量索引):

相关id的保存非常重要。我尝试了很多在这里找到的东西: Convert in R output of package Elastic (nested list?) to data.frame or JSON or here: Extract data from elasticsearch into R with elastic package, load into a data frame, error due to hits not expand到相同的长度 没有任何成功...

有什么想法来处理它吗?我想知道我是否应该转换重新排列的输出(out2)或者是否最好回到原始输出(out)......

提前致谢!

PS:这是“out”的 dput 版本(来自 df Search):

与 out2 相同:

0 投票
2 回答
287 浏览

r - 在R中取消嵌套的纬度/经度坐标列表?

我有一个列表列表。我将在这个问题的底部放置一个嵌套数据的示例。主列表nest_list,有 2 个子列表。2 个子列表中的每一个都由 2 或 3 个 lon/lat 坐标矩阵组成。这些 lon/lat 坐标矩阵中的每一个都构成一条线段。我的最终目标是将所有这些线段导出为一个 shapefile,但是我正在努力将我的数据转换为可行的格式。

我发现这篇关于将纬度/经度表转换为形状文件的有用帖子(使用 R 将坐标表转换为形状文件)。但是,我的数据绝对不是执行此技术的正确格式。我想nest_list成为一个长列表,其中每个 lon/lat 矩阵都是该列表的一个元素。

我尝试使用unnest(nest_list)fromtidyr来获取我的数据来执行此操作,但我收到一个错误,因为nest_list它是一个列表,而不是一个 data.frame。我也试过了lapply(nest_list, unlist)。但这将每个子列表中的所有矩阵组合成一个长向量,所以我最终得到了两个长向量。

您对如何取消嵌套我的数据有任何想法,从而生成一个列表,其中每个纬​​度/经度矩阵都是一个元素?

这是我的数据:

0 投票
1 回答
556 浏览

r - 将数据框中的字符串转换为向量并取消嵌套数据框

给定一个数据框,其中列中的每个观察值都是“x~y”形式的字符串,其中 x 和 y 是整数。

目标是将“x~y”字符串转换为一个向量,c(x..y),它是一个以整数 x 开头并以整数 y 结尾的数字序列。

最后,数据框需要取消嵌套,以便向量的每个元素都有自己的行,并且其他列正确重复。

例如,这是一个数据框:

上述数据框应更改为以下内容:

由于有很多情况,无法设置 str_replace 示例。我如何制作这段代码?

0 投票
1 回答
12982 浏览

sql - SQL(雅典娜)中的取消嵌套:如何将结构数组转换为从结构中提取的值数组?

我从贝叶斯统计模型中抽取样本,用 Avro 序列化它们,将它们上传到 S3,然后用 Athena 查询它们。

我需要帮助编写一个在表中取消嵌套数组的查询。

CREATE TABLE 查询如下所示:

“posterior_samples”列中的“samples”数组是存储样本的位置。我已经设法使用以下查询取消嵌套“posterior_samples”结构:

在此处输入图像描述

现在我想要的是取消父母列。此列中的每条记录都是一个结构数组。我正在尝试创建一个列,该列仅具有该结构数组中“feature_value”键的值数组。(我想要一个数组的原因是父母数组的长度可以> 1)。

换句话说,对于父行中的每个数组,我想要一个大小相同的数组。该数组应仅包含原始数组中结构的“feature_value”键的值。

关于如何解决这个问题的任何建议?

谢谢。

0 投票
2 回答
60 浏览

r - R/Dplyr 从具有逗号分隔单元格值的单元格的数据帧创建更大的数据帧

我正在处理如下所示的数据框。我已尽力将其格式化为 SO。person重要的是,personparty和中有相同数量的逗号分隔条目sponsordate(我已经截断了单元格,因此在此示例中它们可能不一样,但它们在数据集中是相同的)。

我想创建一个包含五列的新数据框。我本质上想将这些(非列表)值取消列出到一个更大的数据框中。

最终的数据框应该有一行用于第 i 个逗号分隔的条目,其中 和 保持相同的列billstatus

因此,例如在我的示例数据集中的第二行中,会有一行带有法案名称(授权拨款拨款的法案......),状态(RESTRICT),Ed Markey,民主党人,21/05/ 2014 年。下一行将是逗号分隔值中的第二个条目(相同的法案名称,相同的状态,参议员 Ed Markey [D-MA],民主党,2015 年 2 月 6 日)等。

对于最后三列中只有一个值的行,它们将保持不变。

我如何从本质上取消这些类似列表的值?

0 投票
1 回答
1497 浏览

r - Unnest() R 不适用于大数据样本

我正在从 JSON 文件中取消嵌套数据。当我制作一个小样本时, unnest() 函数可以工作,但是当我尝试在大型原始数据帧上运行它时,我收到以下错误。

我的代码如下。我们从 GitHub 的 API 获得 JSON 数据。

小数据帧,只有前 100 行

整洁的 repo 数据,未列出语言和代码行

当我过滤或任何其他奇怪的事情时,没有 NA 行。我需要取消嵌套的唯一列是语言。

Languages 是一个包含 2 个列表的列表。第一个列表是名称,具有“Java”、“Python”和“Ruby”等值。这些是字符值。第二个列表是行,具有 104、109432 和 10 等值。这些是整数值。

根据要求提供一些示例代码来复制数据。testdf 将是相关列的数据框和语言。

带有语言的数据框

0 投票
1 回答
909 浏览

r - 将列中的值替换为 NULL

我有一个数据框,我想用 NULL 替换包含值“2018”的列中的所有值。

我有一个数据集,其中列中的每个值都是一个列表。也包括 NULL。其中一个值不是列表,我想用 NULL 替换它。如果我用 NA 替换它,那么该列中的数据类型是混合的。

如果我有如下所示的列,如何将包含 2018 的值替换为 NULL 而不是 NA?

可重现的例子:

我的最终目标是将此函数与此数据集一起使用,以使 action_types 成为自己的列。当列表或 NULL 在操作列中时,此函数起作用: