问题标签 [google-cloud-dataprep]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
372 浏览

google-cloud-platform - 对存储在 BigQuery 中的数据进行预处理

我刚开始使用 GCP,我对正确使用它的一些工具有一些疑问。特别是,我正在尝试将来自 Google Analytics 的数据提取到 BigQuery 中。是否可以对存储在 BigQuery 中的数据使用 Dataprep?我见过的几乎每个示例都使用 Dataprep 来可视化存储在 Google Storage 中的数据,但没有提到 BigQuery。

任何帮助将非常感激。

0 投票
1 回答
232 浏览

pivot - Dataprep 数据透视转换

我是 Dataprep 的新手,现在尝试使用“Pivot Transform”创建数据透视表 https://cloud.google.com/dataprep/docs/html/Pivot-Transform_57344645#example---basic-pivot

我搜索了文档,语法看起来很简单,除了它脱离上下文并且不确定在哪里使用它。语法是: pivot col: (the parameter to be used as col) value: (value to present) group: (what to group by)

我在这里和其他地方找到的其他解决方案都需要大量代码,并且严重依赖于提前了解列,例如:使用case when ____ = 'name of col' 数据透视

任何想法将不胜感激

0 投票
1 回答
388 浏览

google-cloud-platform - Google Cloud Dataprep:由于先前的崩溃,转换引擎不可用(退出代码:-1)

我正在尝试使用 Google Cloud Dataprep 创建流。该流程从 Big Query 获取一个数据集,其中包含来自 Firebase Analytics 的应用事件数据,以展平事件参数以便于分析。在创建第一步(配方)之前,我一直收到以下错误:

由于先前的崩溃,转换引擎不可用(退出代码:-1)

请参阅下面屏幕截图中的右上角

截屏

0 投票
1 回答
1599 浏览

google-bigquery - 无法在数据准备中的列中转义逗号

我正在将逗号分隔的文件导入到 dataprep 中,以加载到 BigQuery 中,不幸的是,其中一列中有一个逗号,在文件被拆分为列之前我似乎无法将其删除。我已将原始格式的数据导入 dataprep,但似乎仍然无法正常工作。

0 投票
1 回答
662 浏览

google-cloud-platform - 如何在谷歌云数据准备中插入值

我在 Dataprep 中的邮政编码不匹配。我需要在输入不正确的列中添加两位数字。

在 Dataprep 中,我收到了替换建议:

'{start}{digit}{3}{end}' with ' '

在替换对话框中,我只能输入一个字符串,而不是'{start}{digit}{3}{end}'因为它将它作为文本读取。我该如何更换:

'{start}{digit}{3}{end}'12 + '{start}{digit}{3}{end}'

替换或插入都可以,但我还没有找到插入的方法。

有什么帮助吗?谢谢。

0 投票
0 回答
37 浏览

google-cloud-dataprep - 导入文件夹时将文件元数据作为列获取

我正在从 Google Data Prep 中的 Google Storage 导入一个文件夹(不是文件)。我需要从存储中获取所有文件的文件名,作为完成数据集中的列。

0 投票
1 回答
118 浏览

google-cloud-dataprep - Dataprep 流程仅限于约 15 个导入的数据集

我想分享我关于 dataprep 产品限制的发现之一。

我是在构建流程中,我需要在进一步处理之前组合一些 json 文件。然后通过最后的参考数据集组合流。

经过一番努力,我注意到当用作输入的 json 文件总数低于 15 个左右时,可以启动数据流作业。

但是,超过此限制将导致失败,无需任何解释。

如果有人可以更深入地了解这个问题,那就太好了: * 为什么会有这样的限制?* 是否是另一个可能让我认为存在限制的问题?* 有没有一种快速的方法来识别 dataprep 中这些类型的问题/错误的来源?* 有没有办法增加输入文件的数量?

干杯,布拉姆

0 投票
1 回答
183 浏览

google-cloud-dataprep - 在谷歌数据准备中重用配方

我正在尝试使用从一个数据集到另一个数据集的现有配方。不幸的是,我无法在谷歌云文档中找到分步过程。

有人可以协助完成这些步骤吗?

谢谢!

0 投票
1 回答
65 浏览

google-cloud-dataprep - 在 google dataprep 中准备一个稀疏数据集(每隔一行空行),导致空输出

这是我在 google dataprep 中发现的另一个错误:

当使用稀疏数据集作为输入(每隔一行一个空行)时,google dataprep 无法处理其上的任何配方。

转换器页面显示初始样本中的所有数据,并且所有配方转换都照常显示。但是,在运行作业时,它会返回一个空集。

如果使用新的随机数据集样本而不是初始样本,它也会返回一个空数据集。

如果有人知道有关此问题的详细信息,将不胜感激!

干杯,布拉姆

0 投票
1 回答
626 浏览

google-cloud-platform - Dataprep:未设置预定目标。创建输出以设置目标

这个错误是什么意思?

未设置预定目的地。创建输出以设置目标。

当我尝试为我的作业创建运行计划时,我在 dataprep 上收到此错误。当我简单地点击运行时,它们工作得很好。但是当我想安排他们时会出现这个错误