(免责声明:我不知道 C++ 标准对此会说什么......我知道,我很可怕)
在处理非常大的字符串时,我注意到 std::string 正在使用写时复制。我设法编写了最小的循环来重现观察到的行为,例如,下面的循环运行得非常快:
#include <string>
using std::string;
int main(void) {
string basestr(1024 * 1024 * 10, 'A');
for (int i = 0; i < 100; i++) {
string a_copy = basestr;
}
}
在循环体中添加写入时a_copy[1] = 'B';
,显然发生了实际复制,并且程序在 0.3 秒内而不是几毫秒内运行。100 次写入使其速度减慢了大约 100 倍。
但后来就变得很奇怪了。我的一些字符串没有写入,只是读取,这没有反映在执行时间上,这几乎与字符串上的操作数量成正比。经过一番挖掘,我发现简单地从字符串中读取仍然会给我带来性能上的损失,所以它让我假设 GNU STL 字符串正在使用读取时复制(?)。
#include <string>
using std::string;
int main(void) {
string basestr(1024 * 1024 * 10, 'A');
for (int i = 0; i < 100; i++) {
string a_copy = basestr;
a_copy[99]; // this also ran in 0.3s!
}
}
在陶醉了一段时间后,我发现从基本字符串中读取(使用 operator[])整个玩具程序也需要 0.3 秒。我对此不是 100% 满意。STL 字符串确实是读取时复制,还是它们根本允许写入时复制?我被引导认为 operator[] 有一些保护措施,可以防止保留它返回的引用并稍后写入它的人;真的是这样吗?如果不是,那么到底发生了什么?如果有人可以指出 C++ 标准中的某些相关部分,那也将不胜感激。
作为参考,我使用g++ (Ubuntu 4.4.3-4ubuntu5) 4.4.3
, 和 GNU STL。