0

我正在尝试以开放优化方式导入从 NoSQL 数据库(Cassandra)中提取的 csv,没有标题并且每条记录的列数不同。

例如,字段以逗号分隔,如下所示:

1 - userid:100456, type:specific, status:read, feedback:valid
2 - userid:100456, status:notread, message:"some random stuff here but with quotation marks", language:french

有最大数量的列,并且不需要对其名称进行清理。

如何制作可以使用数据透视表挖掘的大型 Excel 文件?

4

1 回答 1

1

如果您可以获取 JSON,Refine 将直接摄取它。

如果这不可能,我可能会做一些类似的事情:

  1. 导入为文本行
  2. 分成两列,包含行 ID 和字段
  3. 使用逗号作为分隔符在字段列上拆分多值单元格
  4. 使用冒号将字段列拆分为两列
  5. 在这两列上使用键/值展开成列
于 2013-10-10T19:30:19.780 回答