我正在使用 Matlab 使用 Rocchio 分类方法。我有 160 个 txt 文件。我已经计算了每个文档中每个单词的词频,所以现在有一个 1x160 单元格数组“Set”,它由 160 个单元格组成,每个单元格中有多个整数(文档中每个词的词频)。我试图取每个整数 i,并应用下一个公式 1+log10(i) 来计算词频加权。我想出了下一个代码:
function [tfw]=TFWeighting(Set)
size(Set);
TFW=cell(0);
for i=1:size(Set)
for j=1:size(Set{1,i})
TFW{1,i}(j,1) = 1+log10(Set{1,i}(j,1));
end
end
tfw=TFW;
end
好吧,它有效,但仅适用于第一个单元格。所有其他 159 个单元格均未触及。可能是什么问题?