我在 Octave/Matlab 中创建 MinHash 和 LSH。但是我试图从给定的文档中获取一组大小为 k 的带状疱疹(单元数组或数组),但我不知道该怎么做。
我现在拥有的是这个简单的代码:
doc = fopen(document);
i = 1;
while (! feof(doc) )
txt{i} = strread(fgetl(doc), '%s');
i++;
endwhile
fclose(doc);
这将创建一个包含文档每一行中所有单词的单元格数组,这是我正在尝试执行的函数的一个参数。