performance - 运行 sqlite 查询后如何加快获取结果的速度？

Question

作为对我的问题的回答：sqlite.fetchall() 这么慢是否正常？似乎 fetch-all 和 fetch-one 对于 sqlite 来说可能非常慢。

正如我在那里提到的，我有以下查询：

time0 = time.time()
self.cursor.execute("SELECT spectrum_id, feature_table_id "+
                "FROM spectrum AS s "+
                "INNER JOIN feature AS f "+
                "ON f.msrun_msrun_id = s.msrun_msrun_id "+
                "INNER JOIN (SELECT feature_feature_table_id, min(rt) AS rtMin, max(rt) AS rtMax, min(mz) AS mzMin, max(mz) as mzMax "+
                             "FROM convexhull GROUP BY feature_feature_table_id) AS t "+
                "ON t.feature_feature_table_id = f.feature_table_id "+
                "WHERE s.msrun_msrun_id = ? "+
                "AND s.scan_start_time >= t.rtMin "+
                "AND s.scan_start_time <= t.rtMax "+
                "AND base_peak_mz >= t.mzMin "+
                "AND base_peak_mz <= t.mzMax", spectrumFeature_InputValues)
print 'query took:',time.time()-time0,'seconds'

time0 = time.time()
spectrumAndFeature_ids = self.cursor.fetchall()      
print time.time()-time0,'seconds since to fetchall'

select 语句的执行大约需要 50 秒（可以接受）。但是，fetchall() 需要 788 秒，只获取 981 个结果。

作为对我的问题的回答而提出的加快查询速度的方法：sqlite.fetchall() 这么慢是否正常？使用 fetchmany() 并没有提高获取结果的速度。

运行 sqlite 查询后如何加快获取结果的速度？

与我尝试在命令行上执行它的 sql 完全相同：

sqlite> SELECT spectrum_id, feature_table_id
   ...> FROM spectrum AS s 
   ...> INNER JOIN feature AS f 
   ...> ON f.msrun_msrun_id = s.msrun_msrun_id 
   ...> INNER JOIN (SELECT feature_feature_table_id, min(rt) AS rtMin, max(rt) AS rtMax, min(mz) AS mzMin, max(mz) as mzMax 
   ...> FROM convexhull GROUP BY feature_feature_table_id) AS t 
   ...> ON t.feature_feature_table_id = f.feature_table_id 
   ...> WHERE s.msrun_msrun_id = 1
   ...> AND s.scan_start_time >= t.rtMin
   ...> AND s.scan_start_time <= t.rtMax
   ...> AND base_peak_mz >= t.mzMin
   ...> AND base_peak_mz <= t.mzMax;

更新：

所以我大约 45 分钟前开始在命令行上运行查询，它仍然很忙，所以使用命令行也很慢。

score 2 · Accepted Answer

通过阅读这个问题，听起来您可以从使用APSW sqlite 模块中受益。不知何故，您可能会成为您的 sqlite 模块的受害者，导致您的查询以某种性能较低的方式执行。

我很好奇，所以我自己尝试使用 apsw 。这并不太复杂。你为什么不试一试？

要安装它，我必须：

提取最新版本。
让安装包获取最新的 sqlite 合并。
```
python setup.py fetch --sqlite
```
构建和安装。
```
sudo python setup.py install
```

使用它代替其他 sqlite 模块。

import apsw
<...>
conn = apsw.Connection('foo.db')

performance - 运行 sqlite 查询后如何加快获取结果的速度？

1 回答 1

Related

Reference