1

1.我在catalog.yml文件中使用这个代码

equipment_data:
  type: pandas.ExcelDataSet
  filepath: data\01_raw\Equipment Profile.xlsb
  layer: raw

  1. 执行 kedro run 命令后出现错误。

` kedro.io.core.DataSetError:从数据集 ExcelDataSet 加载数据时失败(filepath=C:/Users/Akshay Salvi/Desktop/Bizmetrics/kedro-environment/petrocaeRepo/data/01_raw/2。循环数据(每次行程) -20210113T042557Z-001/2. 循环数据(每次行程)/CycleData,2020.xlsb, load_args={'engine': xlrd}, protocol=file, save_args={'index': False}, writer_args={'engine' :xlsxwriter})。

Excel 2007 xlsb 文件;不支持`

4

1 回答 1

1

因此,下面的pandas.ExcelDataset简单调用希望您可以从另一个线程中使用引擎(通过安装另一个包提供)来解析它并简单地提供 YAML 目录中的参数。pandaspip install pyxlsbengineload_args

于 2021-02-18T17:45:04.030 回答