0

我正在尝试使用简单的 .csv 文件生成 QuickSight 分析。该文件包含一些任意数据,例如

Yifei, 24, Male, 2
Joe, 30, Male, 3
Winston, 40, Male, 7
Emily, 18, Female, 5
Wendy, 32, Female, 4

我将文件放在 S3 存储桶中,然后使用 AWS Athena 将其解析为表。该表将所有列视为字符串,我可以正确查询

SELECT * FROM users

返回

    name    age gender  consumed
1   Yifei   24  Male    2
2   Joe     30  Male    3
3   Winston 40  Male    7
4   Emily   18  Female  5
5   Wendy   32  Female  4

好的,到目前为止一切都很好。然后在 QuickSight 中,我将表作为数据集导入,它会正确显示在具有正确值的字段下。剩下的唯一问题是ageandconsumed被视为字符串,而不是数字。因此,我创建了两个计算字段:

age_calc: parseInt({age})
consumed_calc: parseInt({consume})

字段截图

工作得很好,现在在字段下我可以看到新创建的具有正确值的字段。但是,一旦我尝试使用 field 创建实际的可视化(例如,每个人消费了多少的饼图)consumed_calc, 的值consumed_calc就是空的。 饼图截图

4

1 回答 1

2

我发现了这个问题。基本上,csv 不能很好地处理空格,因此尽管计算的字段在预览中显示正确的结果,但在解析字段“23”时会出错。删除原始 .csv 文件中的空格解决了这个问题

于 2017-11-20T21:58:01.407 回答