0

我正在尝试为 AutoML Natural Language 创建 JSONL 训练文件,它在文档中说

为了帮助您创建 JSONL 训练文件,AutoML Natural Language 提供了一个 Python脚本,可将纯文本文件转换为适当格式的 JSONL 文件。有关详细信息,请参阅脚本中的注释。

我试图关注评论但我没有得到他们我试着用这个来运行它

python jason.py C:\..dic.csv C:\..text.txt gs://mybucket

但它给了我:

(with 5 blank lines skipped)
Traceback (most recent call last):
  File "jason.py", line 688, in <module>
    main()
  File "jason.py", line 680, in main
    UploadFiles(annotated_files, FLAGS.target_gcs_directory)
  File "jason.py", line 636, in UploadFiles
    f.write(csv_line)
TypeError: write() argument must be str, not bytes

任何人都可以帮我举一个如何运行脚本的例子吗

4

1 回答 1

0

中提供的工具是使用 python2 创建的。您可以运行python2 jsonl_converter.py -s sample_1.txt gs://your-bucket,这样您就不会编辑提供的代码。或者,如果您需要在 python3 中运行它,可以遵循@Justin Ezequiel 的建议。我只是使用 -s 选项来自动拆分长文件。

使用 python 2 进行测试: 在此处输入图像描述

指定 GCS 存储桶中的 JSONL: 在此处输入图像描述

于 2021-02-24T03:04:41.707 回答