0

假设我有一个 std::vector。假设向量包含数字。让我们来看看这个 std::vector

1,3,5,4,3,4,5,1,6,3

std::sort<std::less<int>> will sort this into

1,1,3,3,3,4,4,5,5,6,

我将如何修改排序,以便在排序的同时,它还计算同一级别的数字数量。所以说除了排序之外,还会编译下面的字典[level is also int]

std::map<level, int>

<1, 2>
<2, 3>
<3, 2>
<4, 2>
<5, 1>
<6, 1>

所以有 2 个 1,3 个 3,2 个 4,等等。

我 [认为] 我需要这个的原因是因为我不想对向量进行排序,然后再次计算每个级别的重复数。一次完成似乎更快?

谢谢你们!bjskishore123 是最接近我所要求的内容,但所有的回答都让我受益匪浅。再次感谢。

4

4 回答 4

1

而不是使用向量,

在一个一个存储数字时,使用std::multiset容器

它按排序顺序在内部存储。

在存储每个数字时,使用地图来跟踪每个数字的出现次数。

map<int, int> m;

每次添加一个数字时

m[num]++; 

因此,不需要再通过一次来计算出现次数,尽管您需要在 map 中迭代以获取每个出现次数。

==================================================== ============================

以下是不推荐的替代解决方案。 按照您的要求提供使用 STD::SORT的方式。

下面的代码使用比较函数来计算出现次数。

#include <iostream>
#include <map>
#include <vector>
#include <algorithm>
using namespace std;

struct Elem
{
    int index;
    int num;
};

std::map<int, int> countMap; //Count map
std::map<int, bool> visitedMap;
bool compare(Elem a, Elem b)
{
    if(visitedMap[a.index] == false)
    {
        visitedMap[a.index] = true;
        countMap[a.num]++;
    }
    if(visitedMap[b.index] == false)
    {
        visitedMap[b.index] = true;
        countMap[b.num]++;
    }
    return a.num < b.num;
}

int main()
{
    vector<Elem> v;
    Elem e[5] = {{0, 10}, {1, 20}, {2, 30}, {3, 10}, {4, 20} };
    for(size_t i = 0; i < 5; i++)
        v.push_back(e[i]);

    std::sort(v.begin(), v.end(), compare);

    for(map<int, int>::iterator it = countMap.begin(); it != countMap.end(); it++)
        cout<<"Element : "<<it->first<<" occurred "<<it->second<<" times"<<endl;
} 

输出:

Element : 10 occurred 2 times
Element : 20 occurred 2 times
Element : 30 occurred 1 times
于 2013-05-13T19:59:00.527 回答
1

我不认为你可以一次性做到这一点。假设您提供了自己comparator的排序自定义,它以某种方式尝试计算重复项。

但是,您可以在排序器中捕获的唯一内容是当前正在比较的两个元素的值(可能是引用但无关紧要。您没有其他信息,因为没有将任何其他信息传递给分拣机。std::sort

现在的std::sort工作方式将继续交换元素,直到它们到达排序向量中的正确位置。这意味着单个成员可以多次发送到分拣机,从而无法准确计数。您可以计算某个元素和与其相等的所有其他值被移动了多少次,但不能准确计算其中有多少。

于 2013-05-13T20:26:02.600 回答
1

正如@bjskishore123 所述,您可以使用地图来保证您的集合的正确顺序。作为奖励,您将拥有一个优化的搜索结构(当然是地图)。

在地图中插入/搜索需要 O(log(n)) 时间,而遍历向量是 O(n)。因此,算法是 O(n*log(n))。Wich 与任何需要比较元素的排序算法的复杂性相同:例如,合并排序或快速排序。

这是给您的示例代码:

int tmp[] = {5,5,5,5,5,5,2,2,2,2,7,7,7,7,1,1,1,1,6,6,6,2,2,2,8,8,8,5,5};
std::vector<int> values(tmp, tmp + sizeof(tmp) / sizeof(tmp[0]));
std::map<int, int> map_values;
for_each(values.begin(), values.end(), [&](int value)
{
    map_values[value]++;
});

for(std::map<int, int>::iterator it = map_values.begin();  it != map_values.end(); it++)
{
    std::cout << it->first << ": " << it->second << "times";
}

输出:

1: 4times
2: 7times
5: 8times
6: 3times
7: 4times
8: 3times
于 2013-05-13T20:16:18.073 回答
1

如果您有很多重复项,完成此任务的最快方法可能是首先使用哈希映射计算重复项,即O(n),然后对映射进行排序,其中 是O(m log m)唯一m值的数量。

像这样的东西(在 c++11 中):

#include <algorithm>
#include <unordered_map>
#include <utility>
#include <vector>

std::vector<std::pair<int, int>> uniqsort(const std::vector<int>& v) {
  std::unordered_map<int, int> count;
  for (auto& val : v) ++count[val];
  std::vector<std::pair<int, int>> result(count.begin(), count.end());
  std::sort(result.begin(), result.end());
  return result;
}

主题有很多变化,具体取决于您的需要。例如,也许您甚至不需要对结果进行排序;也许只有计数图就足够了。或者,也许您希望结果是从 int 到 int 的排序映射,在这种情况下,您可以只构建一个常规std::map,而不是。(那将是O(n log m)。)或者,也许您对使它们更快排序的值有所了解(例如它们是已知范围内的小整数。)等等。

于 2013-05-13T22:50:28.723 回答