我正在使用 C++ 从文章算法中提取主题。首先,我编写了代码来删除文章、命题等单词。
然后将其余单词存储在一个 char 数组中:char *excluded_string[50] = { 0 };
while ((NULL != word) && (50 > i)) {
ch[i] = strdup(word);
excluded_string[j]=strdup(word);
word = strtok(NULL, " ");
skp = BoyerMoore_skip(ch[i], strlen(ch[i]) );
if(skp != NULL)
{
i++;
continue;
}
j++;
skp
当 ch[i] 不是articles 或类似的caregory 时为NULL。此功能检查任何单词是否属于文章或提案...等
现在最后 ex..[] 包含一组必需的单词。现在我想在这个数组中出现每个单词,然后是出现次数最多的单词。如果多于一个。
我应该使用什么逻辑?
我的想法是:采用二维数组。第一列将有单词。第二列我可以用来存储计数值。
然后对于每个将该单词发送到数组的单词以及该单词的每次出现都会增加计数值并将该单词的计数值存储在第二列中。
但这既昂贵又复杂。
还有什么想法吗?