_tfx_root
芝加哥出租车示例中的 是指什么,为什么需要它?
元数据结束管道最终在 ~/tfx 中,但没有 tfx git repo 的本地副本,它不会在 Airflow(本地)中运行。
airflow initdb
在您手动将管道 Python 文件复制到目录之后,会在运行时创建元数据$AIRFLOW_HOME/dags/blabla
目录。能够配置~/tfx
虽然的位置会很好。有什么想法吗?
_tfx_root
芝加哥出租车示例中的 是指什么,为什么需要它?
元数据结束管道最终在 ~/tfx 中,但没有 tfx git repo 的本地副本,它不会在 Airflow(本地)中运行。
airflow initdb
在您手动将管道 Python 文件复制到目录之后,会在运行时创建元数据$AIRFLOW_HOME/dags/blabla
目录。能够配置~/tfx
虽然的位置会很好。有什么想法吗?
code:- _tfx_root = os.path.join(os.environ['HOME'], 'tfx');
它用于定义名为“tfx”的目录的相对路径,该目录在登录用户的主目录(如果不存在)中创建。其中 HOME 是一个环境变量。
code:- _pipeline_root = os.path.join(_tfx_root, 'pipelines');
使用相对路径创建/附加子目录“管道”到tfx_root路径。
code:- _metadata_db_root = os.path.join(_tfx_root, 'metadata');
使用相对路径将子目录“元数据”创建/附加到tfx_root路径。
code:- _log_root = os.path.join(_tfx_root, 'logs');
使用相对路径将子目录“logs”创建/附加到tfx_root路径。
它是数据目录的路径。该变量仅用于构建管道、元数据和根目录的路径。
_tfx_root = os.path.join(os.environ['HOME'], 'tfx'); // Create location ~/tfx
_pipeline_root = os.path.join(_tfx_root, 'pipelines'); // Join ~/tfx/pipelines/
_metadata_db_root = os.path.join(_tfx_root, 'metadata'); // Join ~/tfx/metadata/
_log_root = os.path.join(_tfx_root, 'logs'); // Join ~/tfx/logs/
只需修改_tfx_root
以更改~/tfx
. 如果你想要的位置是C:/temp/tfx
. 以此为例。
_tfx_root = 'C:/temp/tfx/';