问题标签 [kedro]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

125 问题

0 投票

1 回答

1285 浏览

python - 在 Kedro 中哪里执行节点输出的保存？

在 Kedro 中，我们可以流水线化不同的节点并部分运行一些节点。当我们部分运行一些节点时，我们需要将一些节点的输入保存在某个地方，以便当另一个节点运行时，它可以访问前一个节点生成的数据。但是，我们在哪个文件中编写代码——pipeline.py、run.py 还是nodes.py？

例如，我试图将 dir 路径直接保存到变量名“model_path”下的 DataCatalog。

来自 pipeline.py 的片段：

但是，当我运行 Kedro 时出现以下错误：

2019-10-18T04:03:49.583

0 投票

1 回答

1335 浏览

python - 如何按照kedro管道中声明的顺序运行节点？

在 Kedro 管道中，节点（类似于 python 函数）是按顺序声明的。在某些情况下，一个节点的输入是前一个节点的输出。但是，有时在命令行中调用 kedro run API 时，节点不会按顺序运行。

在 kedro 文档中，它说默认情况下节点按顺序运行。

我的 run.py 代码：

目前我的最后一个节点有时会在我的前几个节点之前运行。

python machine-learning kedro

2019-11-04T02:38:18.980

0 投票

3 回答

600 浏览

python - 除了几个节点之外，如何运行管道？

我想为不同的文件运行管道，但其中一些不需要所有已定义的节点。我怎样才能通过它们？

python pipeline kedro

2019-11-05T17:23:55.783

0 投票

1 回答

116 浏览

pipeline - 我们如何让管道读取带有特殊字符的列？

我正在使用“usecols”参数来获取 .xlsx 文件的某些列（我正在使用 Kedro 教程中的 xls_local.py 文件），但程序说“usecols 与列不匹配，列预期但未找到：”它只显示具有特殊字符的列。请问我该如何解决这个问题？非常感谢您的关注。

pipeline kedro

2019-11-06T15:22:26.820

0 投票

1 回答

276 浏览

python - 如何在 Kedro 中禁用日志

我未能成功禁用 kedro 日志。我尝试添加disable_existing_loggers: True到 logging.yml 文件以及disable:True所有现有日志中，但它似乎仍在保存日志文件。有什么建议么？

python kedro

2019-11-07T14:40:28.147

0 投票

1 回答

217 浏览

python - 如何从nodes.py文件中的类运行函数？

我想通过 nodes.py 文件中的类来组织节点函数。例如，与清理数据相关的函数在“CleanData”类中，带有@staticmethod 装饰器，而其他函数将留在“Other”类中，没有任何装饰器（这些类的名称仅具有代表性）。在管道文件中，我尝试导入类的名称、节点的名称和以下方式：CleanData.function1（它给出了一个错误）并且它们都不起作用。如果可能的话，我怎样才能从类中调用节点？

python python-3.x class pipeline kedro

2019-11-08T10:29:45.150

0 投票

1 回答

224 浏览

python - 如何选择在 Kedro CSVLocalDataSet 中加载哪些列？

我有一个csv看起来像的文件

我想将它作为 Kedro 加载CSVLocalDataSet，但我不想读取整个文件。我只想要几列（比如说a和b例如）。

我有什么方法可以指定要读取/加载的列列表吗？

python pandas csv kedro

2019-11-08T12:36:12.997

0 投票

1 回答

66 浏览

python - 如何更改 Kedro 中 ParallelRunner 的进程数？

我的管道发出很多 HTTP 请求。这不是一个 CPU 繁重的操作，我想旋转比 CPU 内核数量更多的进程。我怎样才能改变这个？

python kedro

2019-11-11T09:46:18.370

0 投票

1 回答

672 浏览

python - 如何将 Spark 数据帧转换为 Pandas 并返回 Kedro？

我试图了解 Kedro 将来自一个节点的 Spark 数据帧转换为作为另一个节点输入所需的 Pandas 而不创建冗余转换步骤的最佳方法是什么。

python pandas pyspark kedro

2019-11-11T19:33:01.437

0 投票

1 回答

894 浏览

python - 如何将文字值传递给节点？

我有一个功能

现在我需要创建一个节点，但我做不到node(do_something, ["input_data", 1], "output"). 如何将常量值放入节点？

python kedro

2019-11-15T11:11:13.423

1 2 3 4 5 6 7 8 9 10

问题标签 [kedro]

Reference