scala中是否有命令忽略所有类型的数字,例如“ IgnoreNumbers() ~> ”?
我是一个 scala 新手,事实上,我只需要使用这种语言的一个脚本。
非常感谢您的帮助!
这是来自这里的标记器http://nlp.stanford.edu/software/tmt/tmt-0.4/examples/example-1-dataset.scala:
val tokenizer = {
SimpleEnglishTokenizer() ~> // Remove punctuation
CaseFolder() ~> // Lowercase everything
WordsAndNumbersOnlyFilter() ~> // Ignore non-words and non-numbers
MinimumLengthFilter(3) // Take terms with >=3 characters
}