16

在我的一台服务器(i7 Ivy Core,32 GB RAM,Debian 6 @ 64bit,PHP 5.4.10)上,我使用 SQLite 的插入速度非常慢。以下测试程序仅报告每秒 2.2 次插入(插入 30 行需要 14 秒)。

unlink("test.db");

$db = new PDO('sqlite:test.db');

$db->exec("CREATE TABLE test (dummy INT)");

$count = 30;

$t = microtime(true);
for ($i=0; $i<$count; $i++) {
  $db->exec("INSERT INTO test VALUES ($i)")
   or die("SQLite error: ".$db->errorInfo()[2]."\n");
}
$elapsed = microtime(true)-$t;
echo sprintf("%d inserts in %.3f secs (%.1f q/s)\n", 
  $count, $elapsed, $count/$elapsed);

输出:

$ time php test.php
30 inserts in 13.911 secs (2.2 q/s)

real    0m14.634s
user    0m0.004s
sys     0m0.016s

我知道我可以通过在插入语句周围包装BEGIN/来加速这一点END(这给了我 200000 q/s),但即使没有事务,这也应该快得多。在其他(较旧的)机器(相同的 PHP 版本)上,我达到 300+ 查询/秒而无需显式事务。

这可能是什么原因?我必须调整 Sqlite 或操作系统吗?

4

1 回答 1

38

我在 Linux 64 位机器上做了一个类似的测试,strace -C -tt用来了解 SQLite3 在哪里花费时间。

% time     seconds  usecs/call     calls    errors syscall
------ ----------- ----------- --------- --------- ----------------
 99.03    0.004000          32       124           fsync
  0.64    0.000026           0       222           mprotect
  0.32    0.000013           0       216           munmap

明显的延迟在fsync函数中,即:

  • 可配置
  • 取决于一般磁盘 I/O(签出iotop, iostat
  • 严重依赖于 IOSS(因此,文件系统和磁盘分配 - 你可能会在 ext3 上获得一个值,在 xfs 上获得不同的值,在 btrfs 上获得第三个值)
  • 当然,间接地取决于底层硬件及其怪癖或调整。

通过关闭同步,我的 SQLite3 性能提高了大约三千倍:

$db = new PDO('sqlite:test.db');

$db->exec('pragma synchronous = off;');

我在两台非常相似的机器上也有两个不同的值(一个有 ext4,另一个有 XFS,但我不肯定这是主要原因 - 它们的负载配置文件也不同)。

顺便说一句,使用准备好的语句几乎可以将最快级别的执行速度提高一倍(从 45k 到 110k INSERT,分批 3000 次,因为在该速度下,30 次 INSERT 必然会产生虚假的时序),并将最低速度从大约 6到150左右。

因此,这(使用准备好的语句)可能是一个很好的解决方案,可以在不涉及文件同步的情况下改进重复操作,即,同时仍然可以证明数据风险级别保持不变。之后,我会根据数据中断的风险和价值尝试事务或 fsync(甚至可能是内存日志) 。

从头开始设计系统时,肯定建议对不同的 FS 进行一些测试。

不同文件系统(同一台机器)上的测试

ext4 (acl,user_xattr,data=order)         5.5 queries/s
using transactions                       170 queries/s
disabling fsync                        16000 queries/s
using transactions and disabling fsync 47200 queries/s

临时文件系统上,fsync它很便宜,所以关闭它几乎没有什么好处。大部分时间都花在守卫上,所以交易是关键。

tmpfs                                  13700 queries/s
disabling fsync                        15350 queries/s
enabling transactions                  47900 queries/s
using transactions and disabling fsync 48200 queries/s

当然,必须考虑适当的数据组织和索引,并且对于大型数据集,可能会变得更加重要。


更新:为了提高性能,还可以将 SQLite 日志放入内存中pragma journal_mode=MEMORY;

此外,您可以告诉 ext3/4 不要费心在 SQLite 数据库上更新时间(不过,这在很大程度上取决于实现)。您可以尝试添加noatime到数据库所在的文件系统中,如果有效,您可以将其放入/etc/fstab(您也可以使用relatime而不是更极端的noatime

sudo mount /var -o remount,noatime
于 2013-03-14T15:47:22.233 回答