3

我正在尝试调整这个答案

如何在 C++ 中标记字符串?

我当前的字符串问题涉及从文件中读取直到 eof。

从这个源文件:

Fix grammatical or spelling errors

Clarify meaning without changing it

Correct minor mistakes

我想用所有标记化的词创建一个向量。示例:vector<string> allTheText[0] should be "Fix"

我不明白的目的,istream_iterator<std::string> end;但我包括因为它在原始海报的答案中。

到目前为止,我有这个非工作代码:

vector<string> allTheText;
          stringstream strstr;
          istream_iterator<std::string> end;
          istream_iterator<std::string> it(strstr);

          while (!streamOfText.eof()){
                getline (streamOfText, readTextLine);
                cout<<readTextLine<<endl;

                stringstream strstr(readTextLine);
                // how should I initialize the iterators it and end here?

                }

编辑:

我将代码更改为

          vector<string> allTheText;
          stringstream strstr;
          istream_iterator<std::string> end;
          istream_iterator<std::string> it(strstr);

          while (getline(streamOfText, readTextLine)) {
               cout << readTextLine << endl;

        vector<string> vec((istream_iterator<string>(streamOfText)), istream_iterator<string>()); // generates RuntimeError


          }

并得到一个 RuntimeError,为什么?

4

1 回答 1

9

在 C++ 中使用while (!….eof())循环被破坏了,因为当流进入错误状态时循环将永远不会退出!

相反,您应该直接测试流的状态。适应您的代码,这可能如下所示:

while (getline(streamOfText, readTextLine)) {
    cout << readTextLine << endl;
}

但是,您已经一个流。为什么还要将其放入字符串流中?或者您是否需要出于任何原因逐行执行此操作?

您可以使用输入迭代器直接初始化您的向量。无需构建字符串流,也无需使用copy算法,因为有适当的构造函数重载。

vector<string> vec((istream_iterator<string>(cin)), istream_iterator<string>());

注意第一个参数周围的额外括号,这是从函数声明中消除歧义所必需的。

编辑此代码的作用的一个小解释:

C++ 提供了一种指定范围的统一方式。范围只是类型值的集合,没有详细说明这些值是如何存储的。在 C++ 中,这些范围表示为半开区间 [ a, b[。这意味着一个范围由两个迭代器分隔(它们有点像指针,但更通用;指针是一种特殊的迭代器)。第一个迭代器 ,a指向范围的第一个元素。第二个b, 指向最后一个元素的后面。为什么在后面?因为这允许非常容易地迭代元素:

for (Iterator i = a; i != b; ++i)
    cout << *i;

像指针一样,迭代器通过应用于它们来取消引用*。这将返回它们的值。

C++ 中的容器类(例如vector, list)有一个特殊的构造函数,它允许将值从另一个范围轻松复制到新容器中。因此,此构造函数需要两个迭代器。例如,以下将 C 样式的数组复制到向量中:

int values[3] = { 1, 2, 3 };
vector<int> v(values, values + 3);

在这里,values是同义词&values[0],表示它指向数组的第一个元素。values + 3,由于指针算法,几乎等同于&values[3](但这是无效的C++!)并指向数组后面的虚拟元素。

现在,我上面的代码与上一个示例完全相同。唯一的区别是我使用的迭代器类型。我没有使用普通指针,而是使用 C++ 提供的特殊迭代器类。这个迭代器类以这样一种方式包装输入流,即++ 推进输入流并从流*中读取下一个元素。元素的种类由 type 参数指定(因此string在这种情况下)。

为了使它作为一个范围工作,我们需要指定一个开始和结束。唉,我们不知道输入的结尾(这是合乎逻辑的,因为随着用户在控制台中输入更多输入,流的结尾实际上可能会随着时间而移动!)。因此,要创建一个虚拟结束迭代器,我们不将参数传递给istream_iterator. 相反,要创建一个开始迭代器,我们传递一个输入流。然后,这将创建一个迭代器,该迭代器指向流中的当前位置(此处为cin)。

我上面的代码在功能上等同于以下内容:

istream_iterator<string> front(cin);
istream_iterator<string> back;

vector<string> vec;

for (istream_iterator<string> i = front; i != back; ++i)
    vec.push_back(*i);

反过来,这等效于使用以下循环:

string word;
while (cin >> word)
    vec.push_back(word);
于 2009-01-27T21:05:52.093 回答