1

我正在尝试从 mongodb(在 AWS Documentdb 中运行)读取数据并写入 bigquery。

我为此编写了 python 代码并使用 python3 命令运行它。我的管道字符串如下所示:

p | ReadFromMongoDB(uri='mongodb://documentdb_url:27017',db="test_db",coll="test_collection") | beam.Map(json_parse_fun) | 'WriteToBigQuery' >> beam.io.WriteToBigQuery('target_bq_table', write_disposition=beam.io.BigQueryDisposition.WRITE_APPEND)

json_parse_fun() 将 mongodb 数据转换为 JSON 文件。

但是当我运行此代码时,数据流作业失败并出现以下错误:

pymongo.errors.OperationFailure: Feature not supported: splitVector
4

1 回答 1

2

MongoDB 不会“在 DocumentDB 中运行”。

DocumentDB 是一个模仿数据库,实现了 MongoDB 的一些特性。您发现了一个它没有实现的功能。

请参阅文档 db with mongodb 3.6 compatiability 中的“Feature not supported: $text”

于 2021-01-25T13:25:05.613 回答