0

我正在尝试使用Hopkins 等人的自述包。但无法让它与我自己的数据一起使用。演示运行良好,我按照包的预期转换了我的数据(每个文本的单独 txt 文件和带有真实标签的 control.txt 文件等等)。我没能做的是创建 table.file。表格文件包含一个词频表,演示文件在 Excel 中打开时如下所示:

表文件

不幸的是,似乎没有任何关于如何创建这样一个 table.file 的文档。文档只说:

table.file:应存储词频表的文件路径。默认为“tablefile.txt”。当然,用户必须对这个文件有读写权限,文件之前的内容会被覆盖。

任何人都可以指出产生此类文件的程序或代码吗?还是我错过了文档中的某些内容?

4

1 回答 1

0

我搜索了更长的时间,现在已经解决了我自己的问题。我发布它是为了让任何发现它的人都能获得关键线索。

tablefile.txt 是一个制表符分隔的文档术语矩阵,带有三个额外的列:“FILENAME”(要分析的每个文本的文件名,例如 'text21.txt.')、“TRUTH”(类别的真实值;可以是NA 表示测试集),“TRAININGSET”(指示文本是否属于 1 = 训练集或 0 = 测试集)。

可以使用网络上的教程生成文档术语矩阵,例如 this

于 2015-09-04T08:56:25.920 回答