python - 在 Python 中从 Oracle 获取大量数据

Question

我需要在 python 2.6 中从 Oracle（使用 cx_oracle）获取大量数据，并生成一些 csv 文件。

数据大小约为 400k 记录 x 200 列 x 100 个字符。

最好的方法是什么？

现在，使用以下代码...

ctemp = connection.cursor()
ctemp.execute(sql)
ctemp.arraysize = 256
for row in ctemp:
  file.write(row[1])
  ...

...脚本在循环中保持数小时，并且没有任何内容写入文件...（有没有办法为提取的每条记录打印一条消息？）

注意：我对 Oracle 没有任何问题，在 SqlDeveloper 中运行查询非常快。

谢谢你，吉安

score 1 · Accepted Answer

你应该cur.fetchmany()改用。它将获取由 arraysise (256) 定义的行块

Python代码：

def chunks(cur): # 256
    global log, d
    while True:
        #log.info('Chunk size %s' %  cur.arraysize, extra=d)
        rows=cur.fetchmany()

        if not rows: break;
        yield rows

然后在 for 循环中进行处理；

for i, chunk  in enumerate(chunks(cur)):
            for row in chunk:
                     #Process you rows here

这正是我在TableHunter for Oracle中的做法。

score 0 · Accepted Answer

我认为您的代码一次向数据库询问一行数据，这可能解释了速度缓慢。

尝试：

ctemp = connection.cursor()
ctemp.execute(sql)
Results = ctemp.fetchall()
for row in Results:
    file.write(row[1])

score 0 · Accepted Answer

在每一行之后添加打印语句
在循环中添加一个计数器，指示每 N 行之后的进度
查看类似“progressbar”的模块以显示进度指示器

python - 在 Python 中从 Oracle 获取大量数据

3 回答 3

Related

Reference