我正在尝试使用斯坦福主题建模工具箱 (TMT) 来尝试主题建模 [0]。我是 Scala 初学者。但是,我似乎无法通过读取 CSV 文件来准备我的数据集。这是我的代码
import scalanlp.io._;
val source = CSVFile("pubmed-oa-subset.csv") ~> IDColumn(1);
println(source.data.size);
这会引发以下错误
Stanford TMT\example-0-test.scala:6: error: not found: value IDColumn
val source = CSVFile("pubmed-oa-subset.csv") ~> IDColumn(1);
同样,我在其他数据预处理功能(如 Tokenizer)上也遇到错误。这是代码
// Stanford TMT Example 0 - Basic data loading
// http://nlp.stanford.edu/software/tmt/0.4/
import scalanlp.io._;
val source = CSVFile("pubmed-oa-subset.csv") ;
println(source.data.size);
val tokenizer = {
SimpleEnglishTokenizer()
}
这是上述代码收到的错误。
error: not found: value SimpleEnglishTokenizer
SimpleEnglishTokenizer()
我正在使用与 TMT 主页 [1] 上相同的 CSV 文件。此外,脚本和数据位于同一文件夹中。
问题是什么?我无法从 TMT 主页运行完全相同的测试示例。
[0] http://nlp.stanford.edu/software/tmt/tmt-0.4/
[1] http://nlp.stanford.edu/software/tmt/tmt-0.4/examples/pubmed-oa-subset.csv