问题标签 [data-manipulation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用重塑创建纵向数据集
我有数据集:
我使用以下 R 代码:
我想用它来创建具有以下结构的数据集:
但是,当我运行我的代码时,我得到以下输出:
如何修改我的代码以生成所需的输出?
r - 重新排列数据框,以便将行剪切并粘贴为列
我不知道我是否通过标题解释了我的意图,但本质上我想转换
至
我想这样做而不使用 for 循环。我觉得有一些reshape
功能可以做到这一点。我有大量具有这种配置的数据集。所以,我想要一些矢量化解决方案......而且,长度可以是任何东西。这里,在示例数据中,序列长度为 4。另外,我对列名并不挑剔。我可以使用names(dataframe)=c(...
.
python - 在 Python 中循环多个文本文件以提取数据
自 10 月以来,我一直在自学 Python,以便从大约一百万个文本文件中提取数据。我一直在尝试以谨慎的小块来解决这个问题,这样我就不会在尝试一次性获取我想要的所有代码时不知所措/迷失方向。
对于我的第一个块,我想从文本文件中提取地址。到目前为止,我已经设法让我的代码一次处理一个文件,但由于我有超过 100 万个文件要处理,我认为手动执行此操作不会奏效。
为简洁起见,我只包含了我的代码的第一部分,因为其余部分基本上是这个,但正在寻找不同的关键字。
我试图在顶部打开文件一次并多次调用变量,但它不起作用,我假设 for 循环看起来与此类似,但我不知道如何使它工作。
谢谢
r - 将 CSV 从 github 读入 R
我正在尝试将 CSV 从 github 读入 R:
但是,这给了我:
我试过?read.csv
, ?download.file
, getURL
(只返回奇怪的 HTML),以及数据导入手册,但仍然无法理解如何使其工作。
我究竟做错了什么?
r - grep 以连续数字作为后缀的 var 名称
我想要数据框中某些变量的索引,但我的grep()
技能不足。
假设我有这个数据框,
现在,我想要的是grep a1、a2、a11 和 a12(在现实生活中,a
' 后面的 # 是从 1 到 12 的连续列表),我该怎么做?我已经尝试了下面的两个grep,但没有运气。
这个我也试过
我想要的是
其次,谁能指导我一个好的grep()
教程?谢谢!
excel - 在 Excel 工作表中自动生成列
本周数据处理挑战:
我有一个看起来像这样的 Excel 表:
我需要在产品名称周围添加两个带有自动生成文本的额外列,如下所示:
文字仅供说明...
我可以想出几种方法来实现这一点。制作脚本来加载和操作 Excel 文件,使用 SQL Server 集成服务,但我不禁想到有更简单的方法来做到这一点!?
进行这种数据操作的最简单和最优雅的方法是什么?
尽管我已经编程了十多年,但我从未接触过 Excel 中的宏......但也许它们是一个解决方案?
有什么建议么?
问候亚历克斯
python - 检查python字符串格式?
我有一堆字符串,但我只想保留这种格式的字符串:
x/x/xxxx xx:xx
检查字符串是否符合这种格式的最简单方法是什么?(假设我想检查它是否有 2 个 / 和一个 ':' )
r - R中的目标变量重新编码
我正在尝试进行一些文本处理,并且需要重新编码句子的单词,以便在新变量中以特定方式识别目标单词。例如,给定一个看起来像这样的数据框......
我需要创建一个新列,其中目标单词的每个实例(在此示例中,当 d$word="like" 时)都标记为 0,并且句子块中“like”之前的所有单词和“之后的所有单词”都会递减像”增量。每个主题都有多个句子,句子因条件而异,因此循环需要考虑每个主题、每个句子的目标词实例。最终结果应该是这样的。
对不起,如果问题措辞不好,我希望它是有道理的!请注意,每个句子中的目标不在同一个位置(相对于句子的开头)。我对 R 很陌生,可以弄清楚如何增加或减少,但不能在每个句子块中同时做这两件事。关于解决此问题的最佳方法有什么建议吗?非常感谢!
mysql - MySQL 中 group_concat 期间的参考价格和减去另一个价格
我正在处理产品数据提要,目前正在对相关产品进行分组。我几乎得到了我想要的东西,但是,就像一个平庸的赛车手,我在最需要的时候已经用尽了技巧。
为了说明我的问题,我创建了一个简化版本。下面是数据结构:
我目前的查询是:
该查询返回以下行:
我真正需要做的是pprice
从每个 concatenated中减去price
,给我每个 sku 之间的价格差异,而不是它们的绝对价格。这将返回梦想的结果:
总的来说,我在这个提要上花了很多时间,并且真的被困在可能是集成中的最后一个障碍上。我真的很感激一些指导,以帮助我朝着正确的方向前进。
编辑:我将此查询的结果用作“虚拟”产品行,作为组中产品的父级。
c++ - 从字符串中提取数字,例如整数或双精度
我很难想出一种方法来从 getline() 函数中提取的字符串中提取诸如 int 或 double 之类的数字。
//例子:
//文件包含:
// 使用getline函数
// 从字符串数据中提取数字
谢谢你