我正在尝试运行以下代码来为某个应用程序并行填充表。首先定义了以下函数,它应该连接到我的数据库并使用给定的值执行 sql 命令(插入到表中)。
def dbWriter(sql, rows) :
# load cnf file
MYSQL_CNF = os.path.abspath('.') + '/mysql.cnf'
conn = MySQLdb.connect(db='dedupe',
charset='utf8',
read_default_file = MYSQL_CNF)
cursor = conn.cursor()
cursor.executemany(sql, rows)
conn.commit()
cursor.close()
conn.close()
然后是这一段:
pool = dedupe.backport.Pool(processes=2)
done = False
while not done :
chunks = (list(itertools.islice(b_data, step)) for step in
[step_size]*100)
results = []
for chunk in chunks :
print len(chunk)
results.append(pool.apply_async(dbWriter,
("INSERT INTO blocking_map VALUES (%s, %s)",
chunk)))
for r in results :
r.wait()
if len(chunk) < step_size :
done = True
pool.close()
一切正常,没有错误。但最后,我的表是空的,这意味着插入不成功。在许多谷歌搜索之后,我已经尝试了很多方法来解决这个问题(包括添加列名以进行插入)并且没有成功。任何建议,将不胜感激。(在python2.7,gcloud(ubuntu)中运行代码。注意,在这里粘贴后缩进可能有点混乱)
另请注意,“块”完全遵循所需的数据格式。
笔记。这是此示例的一部分 请注意,我在上面的示例(链接)中唯一更改的是,我将创建和插入表的步骤分开,因为我在 gcloud 平台上运行我的代码并且它强制执行 GTID标准。