2

Google Cloud Dataprep 上是否有诸如离散化、规范化和数据转换(分类到数字)之类的功能?

4

2 回答 2

1

离散化在 DataPrep 上作为Binning可用。文档页面不显示版本信息或页面历史记录,因此我不确定何时将此功能添加到 DataPrep。

于 2018-12-27T13:01:47.967 回答
0

该文档有一个规范化技术列表,其中包括修剪 whispace、标准化单位等。来自文档:

修剪空白

您可以通过转换从单个列中删除空格。应用于字符串值的 TRIM 函数删除前导和尾随空格:

set col: myCol value: TRIM(myCol)

还有一个按类别分类的转换操作列表:初始解析、管理列等。例如,在聚合转换文档中:

...

基本用法

aggregate value:MAX(totalSales) group: Region

输出:将数据集重塑为两列:新的 Region 列包含来自源 Region 列的唯一值,max_totalSales 列包含 Region 中每个值的原始 totalSales 列中值的最大值。

……

有关更多详细信息,请参阅完整的转换列表。

于 2018-01-05T11:01:30.967 回答