我正在尝试从 mongodb(在 AWS Documentdb 中运行)读取数据并写入 bigquery。
我为此编写了 python 代码并使用 python3 命令运行它。我的管道字符串如下所示:
p | ReadFromMongoDB(uri='mongodb://documentdb_url:27017',db="test_db",coll="test_collection") | beam.Map(json_parse_fun) | 'WriteToBigQuery' >> beam.io.WriteToBigQuery('target_bq_table', write_disposition=beam.io.BigQueryDisposition.WRITE_APPEND)
json_parse_fun() 将 mongodb 数据转换为 JSON 文件。
但是当我运行此代码时,数据流作业失败并出现以下错误:
pymongo.errors.OperationFailure: Feature not supported: splitVector