Google Cloud Dataprep 上是否有诸如离散化、规范化和数据转换(分类到数字)之类的功能?
问问题
350 次
2 回答
1
离散化在 DataPrep 上作为Binning可用。文档页面不显示版本信息或页面历史记录,因此我不确定何时将此功能添加到 DataPrep。
于 2018-12-27T13:01:47.967 回答
0
该文档有一个规范化技术列表,其中包括修剪 whispace、标准化单位等。来自文档:
修剪空白
您可以通过转换从单个列中删除空格。应用于字符串值的 TRIM 函数删除前导和尾随空格:
set col: myCol value: TRIM(myCol)
还有一个按类别分类的转换操作列表:初始解析、管理列等。例如,在聚合转换文档中:
...
基本用法
aggregate value:MAX(totalSales) group: Region
输出:将数据集重塑为两列:新的 Region 列包含来自源 Region 列的唯一值,max_totalSales 列包含 Region 中每个值的原始 totalSales 列中值的最大值。
……
有关更多详细信息,请参阅完整的转换列表。
于 2018-01-05T11:01:30.967 回答