26

我有以下数据:

FolioA Name1 100
FolioA Name2 110
FolioA Name3 100
FolioB Name1 100
FolioB Name3 106
FolioC Name1 108
FolioC Name2 102
FolioC Name3 110

我只想将唯一的名称(即 Name1、Name2 和 Name3,每个一次)插入

std::vector<std::string> name;

当我遍历数据时。

因此,我有以下代码,我将数据存储在名为 test 的地图中:

std::map<std::string, std::map<std::string, double> >test;
std::map<std::string, std::map<std::string, double > >::iterator it1 = test.begin(), end1 = test.end();
    while (it1 !=end1) {
        std::map<std::string, double>::iterator it2 = it1->second.begin(), end2=it1->second.end();
        **name.push_back(it2->first);**
        ++it2;
    }
    ++it1;
}

但是,目前通过以我的方式将数据推送到名称中,有 3 个 Name1 实例、2 个 Name2 实例和 3 个 Name3 实例,这是我的代码所期望的。如何将其修复为只有唯一名称。

4

5 回答 5

37

由于您想保留给定名称的第一个实例,因此您必须在某个时候执行名称查找。一个只涉及你的向量的简单算法是可以使用std::find检查条目是否已经存在

std::vector<std::string> name;

....
if (std::find(name.begin(), name.end(), someName) == name.end()) {
  // someName not in name, add it
  name.push_back(someName);
}

但是在这里,您每次要插入元素时都在执行搜索,这(本身)取决于O(N)复杂性,O(N*N)为整个算法提供支持。因此,您可以通过使用具有快速查找功能的中间容器进行优化,例如std::set@Chad 建议的一个具有O(logN)查找复杂性的容器,给出O(N*logN)整体,或者像 C++11 的std::unordered_set这样的散列容器,其中具有接近恒定的时间查找,给〜O(N)的整体复杂性。

#include <unordered_set>

std::unordered_set<std::string> name_set;
....

// still need to search, since you want to keep 
// the first instance of each name, and not the last.
// But unordered_set performs the look-up at insertion,
// only inserting if someName not already in the set
name_set.insert(someName);

然后,按照@Chad 的例子,

std::vector<std::string> name(names_set.begin(), name_set.end());

如果您没有 C++11,则哈希映射替代方案是boost::hash_maptr1::hash_map.

于 2012-04-29T21:27:24.110 回答
3

您要求提供示例代码,所以我会这样做:

std::set<std::string> unique_names;

// ...
while (it1 !=end1)
{
    // ...
    // **name.push_back(it2->first);**
    unique_names.insert(it2->first);
}

std::vector<std::string> name(unique_names.begin(), unique_names.end());
于 2012-04-29T23:12:51.517 回答
2

如果您不关心要将哪个实例输入数据结构,std::set将满足您的目的

于 2012-04-29T21:24:51.160 回答
2

也许您应该使用另一个地图而不是矢量来拥有唯一的名称。

std::map < std::string, double > 名称;

于 2012-04-29T21:32:16.140 回答
2

list 具有 .sort() 和 .unique() 的能力,这将为您提供 .

您可以使用迭代器对其进行迭代并使用 initializer_list 对其进行初始化。

对我来说,这些数据实际上更像是一个结构:

#include <iterator>
#include <list>
#include <string>
#include <fstream>

typedef struct NODE_S {
    string name1, name2;
    int n;
} NODE_S NODE;

bool compare_NODE (NODE first, NODE second)
{
    unsigned int i=0;
    if (first.name1 < second.name1) {
        return true;
    } else if (first.name2 < second.name2) {
        return true;
    } else if (first.n < second.n) {
        return true;
    } else { return false;}
}


bool readfile(list<NODE>& ln, string filepath) {
    std::ifstream filein;
    NODE n;
    filein.open(filepath.c_str(), std::iofstream::in);
    if (!filein.good()) {
        filein.close();
        std::cerr << "ERROR: unable to open file \"" << filepath << "\" or file is zero-length." << std::endl;
        return false;
    }
    do {
        filein >> n.name1 >> n.name2 >> n.name3 >> std::skipws;
        ln.push_back(n);
        ln.sort(compare_NODE);
        ln.unique();
        //add node to list

    } while (!filein.good()); //can use .eof here, but if bad disk blocks...
    filein.close();
    return true;
}


int main(int argc, char * argv[], char * envp[]) {
    string filepath="somefile.txt";
    if (!readfile(filepath)) {
        return 1;
    }
    list<NODE>::iterator lni;
    for (lni = ln.begin(); lni != ln.end(); lni++) {
        std::cout<<lni->name1<<' '<<lni->name2<<' '<<lni->n<<std::endl;
    }
    return 0;
}

http://www.cplusplus.com/reference/stl/list/sort/

http://www.cplusplus.com/reference/stl/list/unique/

于 2012-04-30T06:50:00.933 回答