我正在使用 Lustre 文件系统的集群上运行许多 (18k) 批处理作业。作业同时提交,每个大约需要 3 秒,他们使用sqlite3
python 模块写入结果。代码的编写部分非常简单:
with sqlite3.connect(name, timeout=900) as conn:
conn.execute(
"insert into someTable values (?, ?)", (value1, value2))
但是很多工作都会抛出异常:
sqlite3.DatabaseError: database disk image is malformed
而有时
sqlite3.OperationalError: unable to open database file
我猜这与许多工作在写入文件时锁定文件有关,但我的印象是sqlite3
应该知道耐心等待文件空闲。我的错误可能是由于并发写入过多造成的吗?我该如何解决?