1

我正在寻找一些帮助来重塑调查响应数据集,使用 Open Refine(以前的 Google Refine)导出为 csv。

调查的一些背景

  1. Collector 和 responder ID 在后台收集 - ID1 ID2
  2. 用户从长列表中选择任务 - T{n}
  3. 用户输入自定义任务 - OT
  4. 用户评价每个选定任务的重要性 - R1
  5. 用户对每个选定任务的满意度评分 - R2

我们总共有 20 个任务 atm,但这可能会改变。

当前数据集如下:

ID1 | ID2 | T1 | » | T20 | OT | T1 R1 | » | T20 R1 | OT R1 | T1 R2 | » | T20 R2 | OT R2
123 | 789 | 

我正在尝试将数据集重塑为以下格式:

ID1 | ID2 | Task | Importance | Satisfaction

这是原始数据集和重构数据集的要点

另外,我试图阐明我想如何重塑绘图中的数据,这可能会有所帮助

4

2 回答 2

0

这不能通过单击单个按钮来完成。您必须执行三个“将单元格跨列转置为行”(一个用于任务,一个用于重要性,一个用于满意度),然后三个“连接多值单元”,然后三个“拆分多值单元”,最后使用填充填写 ID 列中的空白。截屏视频可能比我的解释更清楚。

在此处输入图像描述

您将在 Gist 的评论中找到 Json 操作。如果您的列与提供的示例具有完全相同的名称,您可以通过将文件复制并粘贴到“撤消/重做 -> 应用”中来将其应用到您的项目中

于 2017-09-01T17:18:25.390 回答
0

尝试以下操作:

  • 使用cells['Task1'].value+"|Importance: "+cells['Task Importance 1'].value+"|Satisfaction:"+cells['Task Satisfaction 1'].value您将需要执行 20 次(每组任务一个)连接每个任务的所有内容
  • 转置所有列之后Response ID(不包括在内)。您可以重复使用此操作
  • 基于管道拆分单元格|
  • 完成重命名和清理值value.replace()
于 2017-09-01T17:13:58.013 回答