我运行了一个查询,最终将返回大约 1700 万行,以 500,000 为单位。一切似乎都很好,但我遇到了以下错误:
Traceback (most recent call last):
File "sql_csv.py", line 22, in <module>
for chunk in pd.read_sql_query(hours_query, db.conn, chunksize = 500000):
File "/Users/michael.chirico/anaconda2/lib/python2.7/site-packages/pandas/io/sql.py", line 1424, in _query_iterator
data = cursor.fetchmany(chunksize)
File "/Users/michael.chirico/anaconda2/lib/python2.7/site-packages/jaydebeapi/\__init__.py", line 546, in fetchmany
row = self.fetchone()
File "/Users/michael.chirico/anaconda2/lib/python2.7/site-packages/jaydebeapi/\__init__.py", line 526, in fetchone
if not self._rs.next(): jpype._jexception.SQLExceptionPyRaisable: java.sql.SQLException: Query failed (#20171013_015410_01255_8pff8):
**Query exceeded maximum time limit of 60.00m**
显然,这样的查询可能需要一些时间;我对此很好(并且分块意味着我知道我不会打破任何 RAM 限制——事实上,我正在运行的文件输出显示查询在崩溃之前完成了 17M 行中的 16M!)。
但我没有看到任何直接的选择read_sql_query
。params
似乎是一个不错的候选人,但我在文档中看不到jaydebeapi
任何提示execute
可能给出的正确参数。
我怎样才能克服这个问题并运行我的完整查询?