我需要在远程 MongoDB 实例中插入一组文档,其中一些文档可能已经驻留在实例中,即具有 _id 参数。我希望 MongoDB 忽略此类文档并提交其余文档。
目前 PyMongo 的 insert 方法的默认行为是,它为远程服务器上遇到的每个重复文档返回一个 DuplicateError 异常。我想把这种行为压制得更火,忘记那种功能。
如果有人知道如何做到这一点。这将是可观的。
我需要在远程 MongoDB 实例中插入一组文档,其中一些文档可能已经驻留在实例中,即具有 _id 参数。我希望 MongoDB 忽略此类文档并提交其余文档。
目前 PyMongo 的 insert 方法的默认行为是,它为远程服务器上遇到的每个重复文档返回一个 DuplicateError 异常。我想把这种行为压制得更火,忘记那种功能。
如果有人知道如何做到这一点。这将是可观的。
对于可能存在重复键错误的批量插入,您需要设置continue_on_error
标志。
使用此标志,即使发生错误,插入也会继续。最后一个错误将被报告getLastError
- 您可以捕获它,或者如果您想要触发并忘记将写入关注设置为 0。
from pymongo import *
client = MongoClient()
coll = client.test.test
coll.drop()
# Add a test document
coll.save({'_id': 1, 'hello': 'world'})
print(coll.count())
# Without the flag - Boom
coll.insert([{"_id": 1, "hello": "world"},
{"_id": 2, "Howdy": "Worldy"}])
print(coll.count())
# With a write concern of 0 - no error but not saved.
coll.insert([{"_id": 1, "hello": "world"},
{"_id": 2, "Howdy": "Worldy"}], w=0)
print(coll.count())
# Will error but will insert as well
coll.insert([{"_id": 1, "hello": "world"},
{"_id": 2, "Howdy": "Worldy"}], continue_on_error=True)
print(coll.count())
# With a continue_on_error and write concern of 0 - will only error if theres
# some socket or network error
coll.insert([{"_id": 1, "hello": "world"},
{"_id": 2, "Howdy": "Worldy"},
{"_id": 3, "Hi": "World"}], w=0, continue_on_error=True)
print(coll.count())