问题标签 [data-wrangling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
46 浏览

python - tf.tensor 的定义明确的维度莫名其妙地是“无”

下面的示例摘自TensorFlow 官方数据管道教程。基本上,将一堆 JPG 的大小调整为(128, 128, 3). 由于某种原因,在应用该操作时,在检查数据集的形状时map(),颜色维度(即 3)变成了 a 。None为什么要挑出第三个维度?(我检查了是否有任何没有(128, 128, 3)但没有找到的图像。)

如果有的话,None应该只显示第一个维度,即计算示例数量的维度,并且不应该影响示例的各个维度,因为——作为嵌套结构——它们应该具有无论如何,相同的形状以便存储为tf.data.Datasets。

TensorFlow 2.1 中的代码是

和产量

为什么None在最后一行?

0 投票
1 回答
48 浏览

r - 在长格式中找到不同的因子值

我有长格式的数据,类似于以下

我想创建一个指标变量,当因子发生变化时(例如,1 表示变化,0 表示没有变化),变化出现的年份。有没有一种有效的方法来做到这一点?

我发现了这个问题: Identifying where value changes in R data.frame column 这有点相关但不处理 id。

0 投票
2 回答
51 浏览

r - 根据下一个值移动列中的值并填充空条目

我有一个数据争论的问题,我不知道如何解决。我有一个数据框,其中一列上的行都向上移动,并且该列没有完全填充。我需要将行向下移动并填充 X 行,具体取决于其他列中有多少数据。

编辑:我改变了我显示数据的方式。之前我贴的是markdown表,容易让人误会。我为此感到抱歉。我正在处理的数据如下所示:

我需要把它变成这样:

关于如何解决这个问题的任何想法都会很棒。理想情况下在 R 中,但 awk 或其他也很好。

0 投票
2 回答
86 浏览

r - 将一列中的文本数据转换为R中的数字数据

我的数据框中有一列作为电影的类型,其中有很多。我想将其转换为用于绘制相关矩阵的数值数据。请帮我这样做。

0 投票
2 回答
2631 浏览

python - how to parse a json column in a df where we append new column using selected keys

Hi I am beginner in python & R. I had a quick question:

so how can I have something like this where I choose the keys & values from display_score portion of the json in dataframe and append them to existing data frame?

I would really appreciate your help in this! I looked at several past posts but I couldn't solve my problem using their approach: Creating Dataframe with JSON Keys
How to insert specific keys from json file into a data frame in Python

0 投票
3 回答
375 浏览

r - 如何基于R中的单行将行转换为列?

我有一个看起来像这样的数据集

我想根据 B 行转换列,使其看起来像这样

我不知道该怎么做。我知道我可以使用 t() 或使用 tidyverse 中的 row_to_columns() 进行完全转换,但结果不是我想要的。初始数据在 B 列中有大约 60 列和 165 个不同的值。

0 投票
2 回答
135 浏览

r - 将多列中的行值转换为 R 中的列名?

我有一个如下所示的数据框:

我希望每一行的值是列名,数值是行值:

我如何在 R 中做到这一点?

或者更复杂的场景:

这就是我要的:

0 投票
0 回答
16 浏览

python - 部分转置 - 数据争吵 - python

我有一个数据集(下面的代码)- 如下所示-

在此处输入图像描述

我想将其转换为如下所示 -

在此处输入图像描述

有没有一种pythonic方法来实现这一点 - 除了获得唯一的“类别”,转置它然后循环遍历 Amount 列以找到相应的数量?它不是精确的转置或分组,而是类似的东西。

0 投票
1 回答
60 浏览

r - 如何获得多个结果来运行观察函数?

我将如何多次运行它?

我有一个名为 percent_people 的变量,它查看变量国家/地区是否有 5000000 人,并且有一个名为 city_share 的变量查看每个城市的百分比份额,例如 London = 40%,百分比变量具有不同级别的多少他们可能会失业(即从 100% 到 75% 或 50% 或 25%),这些不同的百分比会如何影响失业率的变化?

但是,现在我只能引入一个 city_share 和一个 percent_people 变量。我如何对其进行编码,以便我可以遍历每个变量的多个输入?

现在我有以下内容:

0 投票
2 回答
43 浏览

javascript - 计算一些基本操作并使用javascript转换一个json数组

具有这种格式的 json 数组:

如何value使用 Javascript 按城市和日期计算最大值和最小值?

例如,我有以下values 16、22 和 20 for day: 1andcity: "New York"我想得到max: 22and min: 16。一旦计算出来,我想将这些新值附加到所有对象,无论year, 包含day: 1什么city: "New York"

计算最大值或最小值不是问题。我在获取所需结果所需的 for 循环结构方面遇到问题。谢谢!