我在数据库中有数百万条记录,我想通过 Python 读取它并将其存储在 pandas 数据框中。问题是选择查询处理时间非常长。为了减少查询处理时间,我尝试对其执行多线程,我创建了 3 个线程并根据每个线程进行查询,例如
Select * from ( select *,rownum over (order by col1) rn from table) where rn%3=0
Select * from ( select *,rownum over (order by col1) rn from table) where rn%3=1
Select * from ( select *,rownum over (order by col1) rn from table) where rn%3=2
然后我通过 threading 包在 Python 中使用线程运行每个查询。
但它也没有减少很多时间
我可以采取任何其他方法来减少查询阅读时间。注意-我同时使用了 jdbc 和 odbc 连接