2

我有一个CSV文件,我试图从Mosaic Decisions中的Amazon S3读取该文件。该文件包含一个地址列,其中数据本身包含一个逗号

文件中的示例数据如下所示:

Address
sl,name,address
1,Ratan Kumar,FlatNo 122,Mumbai,Maharashtra

在这种情况下,地址字段被分成 3 列作为地址,Missing_header_0,Missing_header_1,数据被读取为

sl,name,address,Missing_header_0, Missing_header_1
1,Ratan Kumar,FlatNo 122,Mumbai,Maharashtra

这会破坏实际数据并覆盖下一列数据我们如何避免这种情况?

4

2 回答 2

4

为了避免这种情况,

  1. 打开 Reader 节点配置
  2. 在配置选项卡中可用的引用文本框中传递单引号 (') 或双引号 (")

Mosaic Decisions 的此功能允许将每个字段中的数据用引号括起来。

这将给出预期的结果。

参考截图

于 2020-10-05T05:24:40.407 回答
2

包含分隔符的字段应该用双引号引起来:

sl,name,address
1,Ratan Kumar,"FlatNo 122,Mumbai,Maharashtra"

如果您无法控制此文件的创建,您可以联系创建者并要求修复格式错误的 csv 文件,或者编写一些自定义代码/脚本来解析前 2 个字段并将该行的其余部分视为第三个字段(如果地址字段确实是最后一个字段)。

于 2020-10-05T12:44:02.730 回答