问题标签 [data-manipulation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
448 浏览

r - 使用重塑创建纵向数据集

我有数据集:

我使用以下 R 代码:

我想用它来创建具有以下结构的数据集:

但是,当我运行我的代码时,我得到以下输出:

如何修改我的代码以生成所需的输出?

0 投票
3 回答
1109 浏览

r - 重新排列数据框,以便将行剪切并粘贴为列

我不知道我是否通过标题解释了我的意图,但本质上我想转换

我想这样做而不使用 for 循环。我觉得有一些reshape功能可以做到这一点。我有大量具有这种配置的数据集。所以,我想要一些矢量化解决方案......而且,长度可以是任何东西。这里,在示例数据中,序列长度为 4。另外,我对列名并不挑剔。我可以使用names(dataframe)=c(....

0 投票
1 回答
313 浏览

python - 在 Python 中循环多个文本文件以提取数据

自 10 月以来,我一直在自学 Python,以便从大约一百万个文本文件中提取数据。我一直在尝试以谨慎的小块来解决这个问题,这样我就不会在尝试一次性获取我想要的所有代码时不知所措/迷失方向。

对于我的第一个块,我想从文本文件中提取地址。到目前为止,我已经设法让我的代码一次处理一个文件,但由于我有超过 100 万个文件要处理,我认为手动执行此操作不会奏效。

为简洁起见,我只包含了我的代码的第一部分,因为其余部分基本上是这个,但正在寻找不同的关键字。

我试图在顶部打开文件一次并多次调用变量,但它不起作用,我假设 for 循环看起来与此类似,但我不知道如何使它工作。

谢谢

0 投票
10 回答
63036 浏览

r - 将 CSV 从 github 读入 R

我正在尝试将 CSV 从 github 读入 R:

但是,这给了我:

我试过?read.csv, ?download.file, getURL(只返回奇怪的 HTML),以及数据导入手册,但仍然无法理解如何使其工作。

我究竟做错了什么?

0 投票
3 回答
512 浏览

r - grep 以连续数字作为后缀的 var 名称

我想要数据框中某些变量的索引,但我的grep()技能不足。

假设我有这个数据框,

现在,我想要的是grep a1、a2、a11 和 a12(在现实生活中,a' 后面的 # 是从 1 到 12 的连续列表),我该怎么做?我已经尝试了下面的两个grep,但没有运气。

这个我也试过

我想要的是

其次,谁能指导我一个好的grep()教程?谢谢!

0 投票
1 回答
294 浏览

excel - 在 Excel 工作表中自动生成列

本周数据处理挑战:

我有一个看起来像这样的 Excel 表:

我需要在产品名称周围添加两个带有自动生成文本的额外列,如下所示:

文字仅供说明...

我可以想出几种方法来实现这一点。制作脚本来加载和操作 Excel 文件,使用 SQL Server 集成服务,但我不禁想到有更简单的方法来做到这一点!?

进行这种数据操作的最简单和最优雅的方法是什么?

尽管我已经编程了十多年,但我从未接触过 Excel 中的宏......但也许它们是一个解决方案?

有什么建议么?

问候亚历克斯

0 投票
3 回答
58355 浏览

python - 检查python字符串格式?

我有一堆字符串,但我只想保留这种格式的字符串:

x/x/xxxx xx:xx

检查字符串是否符合这种格式的最简单方法是什么?(假设我想检查它是否有 2 个 / 和一个 ':' )

0 投票
3 回答
268 浏览

r - R中的目标变量重新编码

我正在尝试进行一些文本处理,并且需要重新编码句子的单词,以便在新变量中以特定方式识别目标单词。例如,给定一个看起来像这样的数据框......

我需要创建一个新列,其中目标单词的每个实例(在此示例中,当 d$word="like" 时)都标记为 0,并且句子块中“like”之前的所有单词和“之后的所有单词”都会递减像”增量。每个主题都有多个句子,句子因条件而异,因此循环需要考虑每个主题、每个句子的目标词实例。最终结果应该是这样的。

对不起,如果问题措辞不好,我希望它是有道理的!请注意,每个句子中的目标不在同一个位置(相对于句子的开头)。我对 R 很陌生,可以弄清楚如何增加或减少,但不能在每个句子块中同时做这两件事。关于解决此问题的最佳方法有什么建议吗?非常感谢!

0 投票
1 回答
577 浏览

mysql - MySQL 中 group_concat 期间的参考价格和减去另一个价格

我正在处理产品数据提要,目前正在对相关产品进行分组。我几乎得到了我想要的东西,但是,就像一个平庸的赛车手,我在最需要的时候已经用尽了技巧。

为了说明我的问题,我创建了一个简化版本。下面是数据结构:

我目前的查询是:

该查询返回以下行:

我真正需要做的是pprice从每个 concatenated中减去price,给我每个 sku 之间的价格差异,而不是它们的绝对价格。这将返回梦想的结果:

总的来说,我在这个提要上花了很多时间,并且真的被困在可能是集成中的最后一个障碍上。我真的很感激一些指导,以帮助我朝着正确的方向前进。

编辑:我将此查询的结果用作“虚拟”产品行,作为组中产品的父级。

0 投票
2 回答
1602 浏览

c++ - 从字符串中提取数字,例如整数或双精度

我很难想出一种方法来从 getline() 函数中提取的字符串中提取诸如 int 或 double 之类的数字。

//例子:

//文件包含:

// 使用getline函数

// 从字符串数据中提取数字

谢谢你