我花了一些时间寻找答案,但没有找到任何令人满意的答案。
只是对一些更有经验的 C++ 人如何解决这类问题感兴趣,因为现在我正在做更多与生产相关的编码而不是原型设计。
假设您有一个类,其中包含一个 unordered_map(hashmap),其中包含大量数据,例如 500Mb。您想编写一个以有效方式返回该数据的某个子集的访问器。
采取以下方式,其中 BigData 是一些存储适量数据的类。
Class A
{
private:
unordered_map<string, BigData> m_map; // lots of data
public:
vector<BigData> get10BestItems()
{
vector<BigData> results;
for ( ........ // iterate over m_map and add 10 best items to results
// ...
return results;
}
};
访问器 get10BestItems 在此代码中效率不高,因为它首先将项目复制到结果向量,然后在函数返回时复制结果向量(从函数堆栈复制)。
由于各种原因,您不能在 c__ 中拥有引用向量,这将是显而易见的答案:
vector<BigData&> results; // vector can't contain references.
您可以在堆上创建结果向量并传递对它的引用:
vector<BigData>& get10BestItems() // returns a reference to the vector
{
vector<BigData> results = new vector<BigData>; // generate on heap
for ( ........ // iterate over m_map and add 10 best items to results
// ...
return results; // can return the reference
}
但是,如果您不小心,您将遇到内存泄漏问题。它也很慢(堆内存)并且仍然将数据从映射复制到向量。
所以我们可以回顾一下 c 风格的编码,只使用指针:
vector<BigData*> get10BestItems() // returns a vector of pointers
{
vector<BigData*> results ; // vectors of pointers
for ( ........ // iterate over m_map and add 10 best items to results
// ...
return results;
}
但大多数消息来源说,除非绝对必要,否则不要使用指针。有使用 smart_pointers 和 boost ptr_vector 的选项,但我宁愿尽量避免这些。
我不认为地图将是静态的,所以我不太担心错误的指针。如果代码必须不同来处理指针,这只是一个问题。从风格上讲,这并不令人愉快:
const BigData& getTheBestItem() // returns a const reference
{
string bestID;
for ( ........ // iterate over m_map, find bestID
// ...
return m_map[bestID] ; // return a referencr to the best item
}
vector<BigData*> get10BestItems() // returns a vector of pointers
{
vector<BigData*> results ; // vectors of pointers
for_each ........ // iterate over m_map and add 10 best items to results
// ...
return results;
};
例如,如果您想要一个项目,那么返回参考很容易。
最后的选择是简单地将哈希映射公开并返回一个键向量(在这种情况下为字符串):
Class A
{
public:
unordered_map<string, BigData> m_map; // lots of data
vector<string> get10BestItemKeys()
{
vector<string> results;
for (........ // iterate over m_map and add 10 best KEYS to results
// ...
return results;
}
};
A aTest;
... // load data to map
vector <string> best10 = aTest.get10BestItemKeys();
for ( .... // iterate over all KEYs in best10
{
aTest.m_map.find(KEY); // do something with item.
// ...
}
什么是最好的解决方案?速度很重要,但我想要易于开发和安全的编程实践。