我正在使用 TensorFlow Extended 并堆栈在加载的 .csv 文件中。此文件有;
分隔,默认无法读取 TFX 生成器CsvExampleGen()
。它抛出以下错误:ValueError: Columns do not match specified csv headers
我发现这个问题与内部依赖关系有关,例如tft.coders.CsvCoder()
不需要默认参数来解析 .csv 文件。
问题如下:
- 如何从中抛出
tft.coders.CsvCoder()
参数tfx.components.CsvExampleGen
?
from tfx.components import CsvExampleGen
from tfx.utils.dsl_utils import external_input
data_path = './data'
intro_component = CsvExampleGen(input=external_input(data_path))
...