有两个string
变量,m
和n
:
#include <string>
string m = "0100700\0"
cout << m.size() << endl; // it prints: 7
string n;
n += "0100700"
n += '\0';
cout << n.size() << endl; // it prints: 8
我以为两者都有 8 个字符,但m
只有 7 个字符和n
8 个字符。为什么会这样?
有两个string
变量,m
和n
:
#include <string>
string m = "0100700\0"
cout << m.size() << endl; // it prints: 7
string n;
n += "0100700"
n += '\0';
cout << n.size() << endl; // it prints: 8
我以为两者都有 8 个字符,但m
只有 7 个字符和n
8 个字符。为什么会这样?
首先要注意的是,std::string
它没有可以从底层数组推断字符串文字长度的构造函数。它有一个构造函数,它接受 aconst char*
并将其视为以 null 结尾的字符串。这样做时,它会复制字符,直到找到第一个\0
.
这是 中使用的构造函数string m = "0100700\0";
,这就是为什么在第一种情况下您的字符串长度为 7。请注意,没有其他方法可以从指向其第一个元素的指针获取 char 数组的长度。
在第二个示例中,您将一个字符添加到长度为 7 的预先存在的std::string
对象。这会将长度增加到 8。如果您要遍历字符串的元素,您将能够看到第 8 个元素是'\0'
。
for (auto c: n)
if (c == 0) std::cout << "null terminator" << std::endl;
为了初始化包含'\0'
字符的字符串,您可以选择:
使用初始化列表:
std::string s{'a', 'b', '\0', 'd', 'e', '\0', 'g'};
std::string
使用的迭代器构造函数从不同的容器或数组构造:
std::vector<char> v{'a', 'b', '\0', 'd', 'e', '\0', 'g'};
char c[] = {'a', 'b', '\0', 'd', 'e', '\0', 'g'};
const char* ps = "ab\0de\0g";
std::string s0(std::begin(v), std::end(v));
std::string s1(std::begin(c), std::end(c));
std::string s2(ps, ps + 8);
在第一个样本中
string m = "0100700\0";
该string
变量由字符文字构成,并获取所有字符,直到'\0'
找到的第一个字符。
然而,第二个示例显示,您可以'\0'
向 a 添加任意数量的附加字符std::string
并增加它的大小。
要从您的评论中回答问题:
要从包含'\0'
字符的文字初始化字符串,您可以明确指定计数
string m("0100700\0",8);
或者您可以使用 afirst
和last
迭代器来使用构造函数:
const char x[] = "0100700\0";
string m(std::begin(x),std::end(x));