2

我正在尝试将逗号分隔的字符串转换为 const char* 的向量。使用以下代码,预期的输出是

ABC_
DEF
HIJ

但我明白了

HIJ
DEF
HIJ

我哪里错了?

代码:

#include <iostream>
#include <boost/tokenizer.hpp>
#include <vector>
#include <string>
using namespace std;

int main()
{
   string s("ABC_,DEF,HIJ");
   typedef boost::char_separator<char> char_separator;
   typedef boost::tokenizer<char_separator> tokenizer;

   char_separator comma(",");
   tokenizer token(s, comma);
   tokenizer::iterator it;

   vector<const char*> cStrings;

   for(it = token.begin(); it != token.end(); it++)
   {
      //cout << (*it).c_str() << endl;
      cStrings.push_back((*it).c_str());
   }

   std::vector<const char*>::iterator iv;
   for(iv = cStrings.begin(); iv != cStrings.end(); iv++)
   {
      cout << *iv << endl;
   }
   return 0;
}

http://ideone.com/3tvnUs

编辑:借助以下答案的解决方案:(PaulMcKenzie 使用列表提供了一个更简洁的解决方案。)

#include <iostream>
#include <boost/tokenizer.hpp>
#include <vector>
#include <string>
using namespace std;

char* createCopy(std::string s, std::size_t bufferSize)
{
   char* value = new char[bufferSize];
   memcpy(value, s.c_str(), (bufferSize - 1));
   value[bufferSize - 1] = 0;
   return value;
}

int main()
{
   string s("ABC_,DEF,HIJ");
   typedef boost::char_separator<char> char_separator;
   typedef boost::tokenizer<char_separator> tokenizer;

   char_separator comma(",");
   tokenizer token(s, comma);
   tokenizer::iterator it;

   vector<const char*> cStrings;

   for(it = token.begin(); it != token.end(); it++)
   {
      //cout << it->c_str() << endl;
      cStrings.push_back(createCopy(it->c_str(),
                                      (it->length() + 1)));
   }

   std::vector<const char*>::iterator iv;
   for(iv = cStrings.begin(); iv != cStrings.end(); iv++)
   {
      cout << *iv << endl;
   }

   //delete allocations by new
   //...
   return 0;
}
4

2 回答 2

5

事情是这样的:boost::tokenizer::iterator不会返回您对字符串副本的所有权,而是对内部副本的引用。

例如,运行您的代码后,我得到:

HIJ
HIJ
HIJ

解决方案是cStrings.push_back((*it).c_str())用以下之一替换:

    char* c = new char[it->length() + 1];
    c[it->length()] = 0;
    cStrings.push_back(c);
    std::strncpy(c, it->c_str(), it->length());

看起来不漂亮,但你可能不会比这更快(至少如果你想使用boost::tokenizer.

另一个选项是完全替换boost::tokenizer为例如strtok- 可以在此处找到示例:C split a char array into different variables

您也可以使用boost::algorithm::string::split,但您可能需要string稍后重新映射const char*

于 2015-05-11T22:27:41.687 回答
1

这是一种不需要动态分配的方法,同时为您提供您正在寻找的 std::vector。诀窍是在“永久”存储中创建您的参数,然后将指针向量设置为该存储。

下面的代码std::list用于永久存储。原因是我们可以保证std::list当我们向列表容器中添加项目时,项目的迭代器不会失效。这是构建 的最终向量时的必要要求const char *

#include <iostream>
#include <boost/tokenizer.hpp>
#include <vector>
#include <string>
#include <list>

typedef std::vector<char> CharArray;
typedef std::list<CharArray> StringList;

using namespace std;

int main()
{
   StringList sList;

   string s("ABC_,DEF,HIJ");
   typedef boost::char_separator<char> char_separator;
   typedef boost::tokenizer<char_separator> tokenizer;

   char_separator comma(",");
   tokenizer token(s, comma);
   tokenizer::iterator it;

   vector<const char*> cStrings;

   for(it = token.begin(); it != token.end(); ++it)
   {
        // create an array of char and place on list
        sList.push_back(CharArray(it->begin(), it->end()));

        // null terminate this entry
        sList.back().push_back(0);

        // add the pointer to this entry to the vector of const char *.
        cStrings.push_back(&sList.back()[0]);
   }

   std::vector<const char*>::iterator iv;
   for(iv = cStrings.begin(); iv != cStrings.end(); iv++)
   {
      cout << *iv << endl;
   }
}

请注意,我们不必在这里动态分配内存。您唯一需要确保的是StringList不会超出范围,因为这是您的参数所在的位置。

于 2015-05-12T01:26:48.857 回答