问题标签 [google-cloud-dataprep]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-platform - 对存储在 BigQuery 中的数据进行预处理
我刚开始使用 GCP,我对正确使用它的一些工具有一些疑问。特别是,我正在尝试将来自 Google Analytics 的数据提取到 BigQuery 中。是否可以对存储在 BigQuery 中的数据使用 Dataprep?我见过的几乎每个示例都使用 Dataprep 来可视化存储在 Google Storage 中的数据,但没有提到 BigQuery。
任何帮助将非常感激。
pivot - Dataprep 数据透视转换
我是 Dataprep 的新手,现在尝试使用“Pivot Transform”创建数据透视表 https://cloud.google.com/dataprep/docs/html/Pivot-Transform_57344645#example---basic-pivot
我搜索了文档,语法看起来很简单,除了它脱离上下文并且不确定在哪里使用它。语法是:
pivot col: (the parameter to be used as col) value: (value to present) group: (what to group by)
我在这里和其他地方找到的其他解决方案都需要大量代码,并且严重依赖于提前了解列,例如:使用case when ____ = 'name of col'
数据透视
任何想法将不胜感激
google-cloud-platform - Google Cloud Dataprep:由于先前的崩溃,转换引擎不可用(退出代码:-1)
我正在尝试使用 Google Cloud Dataprep 创建流。该流程从 Big Query 获取一个数据集,其中包含来自 Firebase Analytics 的应用事件数据,以展平事件参数以便于分析。在创建第一步(配方)之前,我一直收到以下错误:
由于先前的崩溃,转换引擎不可用(退出代码:-1)
请参阅下面屏幕截图中的右上角
google-bigquery - 无法在数据准备中的列中转义逗号
我正在将逗号分隔的文件导入到 dataprep 中,以加载到 BigQuery 中,不幸的是,其中一列中有一个逗号,在文件被拆分为列之前我似乎无法将其删除。我已将原始格式的数据导入 dataprep,但似乎仍然无法正常工作。
google-cloud-platform - 如何在谷歌云数据准备中插入值
我在 Dataprep 中的邮政编码不匹配。我需要在输入不正确的列中添加两位数字。
在 Dataprep 中,我收到了替换建议:
'{start}{digit}{3}{end}' with ' '
在替换对话框中,我只能输入一个字符串,而不是'{start}{digit}{3}{end}'
因为它将它作为文本读取。我该如何更换:
'{start}{digit}{3}{end}'
和12 + '{start}{digit}{3}{end}'
替换或插入都可以,但我还没有找到插入的方法。
有什么帮助吗?谢谢。
google-cloud-dataprep - 导入文件夹时将文件元数据作为列获取
我正在从 Google Data Prep 中的 Google Storage 导入一个文件夹(不是文件)。我需要从存储中获取所有文件的文件名,作为完成数据集中的列。
google-cloud-dataprep - Dataprep 流程仅限于约 15 个导入的数据集
我想分享我关于 dataprep 产品限制的发现之一。
我是在构建流程中,我需要在进一步处理之前组合一些 json 文件。然后通过最后的参考数据集组合流。
经过一番努力,我注意到当用作输入的 json 文件总数低于 15 个左右时,可以启动数据流作业。
但是,超过此限制将导致失败,无需任何解释。
如果有人可以更深入地了解这个问题,那就太好了: * 为什么会有这样的限制?* 是否是另一个可能让我认为存在限制的问题?* 有没有一种快速的方法来识别 dataprep 中这些类型的问题/错误的来源?* 有没有办法增加输入文件的数量?
干杯,布拉姆
google-cloud-dataprep - 在谷歌数据准备中重用配方
我正在尝试使用从一个数据集到另一个数据集的现有配方。不幸的是,我无法在谷歌云文档中找到分步过程。
有人可以协助完成这些步骤吗?
谢谢!
google-cloud-dataprep - 在 google dataprep 中准备一个稀疏数据集(每隔一行空行),导致空输出
这是我在 google dataprep 中发现的另一个错误:
当使用稀疏数据集作为输入(每隔一行一个空行)时,google dataprep 无法处理其上的任何配方。
转换器页面显示初始样本中的所有数据,并且所有配方转换都照常显示。但是,在运行作业时,它会返回一个空集。
如果使用新的随机数据集样本而不是初始样本,它也会返回一个空数据集。
如果有人知道有关此问题的详细信息,将不胜感激!
干杯,布拉姆
google-cloud-platform - Dataprep:未设置预定目标。创建输出以设置目标
这个错误是什么意思?
未设置预定目的地。创建输出以设置目标。
当我尝试为我的作业创建运行计划时,我在 dataprep 上收到此错误。当我简单地点击运行时,它们工作得很好。但是当我想安排他们时会出现这个错误