我想使用斯坦福解析器版本 3.7.0(最后一个)解析具有通用依赖项的法语文本。
这是我的命令:
"java -mx2100m -cp stanford-parser.jar:stanford-french-corenlp-2016-10-31-models.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser -MAX_ITEMS 5000000 -encoding utf-8 -outputFormat conll2007 -outputFormatOptions includePunctuationDependencies -sentences newline frenchFactored.ser.gz "+startinDir+"/"+fic+" > "+startinDir+"/Parses_FR/"+fic_name
我使用最后可用的模型https://nlp.stanford.edu/software/lex-parser.shtml#Download
但是我的输出不包含任何功能,并且 POS 不是 UD 的
1 拉 _ DD _ 2 空 _ _
2 pluie _ NN _ 3 NULL _ _
3 蝙蝠 _ VV _ 0 根 _ _
4 les _ DD _ 5 NULL _ _
5 carreaux _ NN _ 3 NULL _ _
我也在尝试使用 CoreNLP 的解析器工具,这是我的命令行:
java -mx1g -cp stanford-corenlp-3.7.0.jar:stanford-french-corenlp-2016-10-31-models.jar edu.stanford.nlp.pipeline.StanfordCoreNLP -props StanfordCoreNLP-french.properties -annotators tokenize,ssplit,pos,depparse -file /Users/Rafael/Desktop/LANGAGES/CORPUS/Sentences_FR/3aube_schtrouFR30.txt -outputFormat sortie.txt
我的属性文件包含以下几行:
注释器 = 标记化、分割、位置、解析
tokenize.language = fr
parse.model = edu/stanford/nlp/models/lexparser/frenchFactored.ser.gz
pos.model = edu/stanford/nlp/models/pos-tagger/french/french.tagger
depparse.model = edu/stanford/nlp/models/parser/nndep/UD_French.gz depparse.language = 法语
我收到以下错误消息
原因:java.io.IOException:无法将“edu/stanford/nlp/models/pos-tagger/french/french.tagger”作为类路径、文件名或 URL 打开
我该如何解决?