我正在尝试处理文章或任何段落的内容[每个字符串]。首先,我将使用strtok()
.
之后,我想将每个单词存储在哈希表中(因为我认为这是处理大数据的最佳方式)。在处理每个单词时,我想存储每个单词的出现。最后我想得到出现时间最长的单词。
unordered_map
存储带有键值的元素,并允许快速检索带有键的元素。这可能对我有用。
我不擅长 C++,所以想要一些意见。
存储整个包含
char *ch ="content of article"
是继续或 string::str 的好方法?我只熟悉第一个。第二,我在处理函数时感觉很复杂。将整个内容(字符串)存储到
unordered_map()
中,然后如何创建包含作为单词的元素的哈希表,并且它会随之发生。然后我能得到最多出现的单词吗?有没有其他 C++ 函数可以帮助我做我想做的事。