1

我想使用斯坦福解析器版本 3.7.0(最后一个)解析具有通用依赖项的法语文本。

这是我的命令:

"java -mx2100m -cp stanford-parser.jar:stanford-french-corenlp-2016-10-31-models.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser -MAX_ITEMS 5000000 -encoding utf-8 -outputFormat conll2007 -outputFormatOptions includePunctuationDependencies -sentences newline frenchFactored.ser.gz "+startinDir+"/"+fic+" > "+startinDir+"/Parses_FR/"+fic_name

我使用最后可用的模型https://nlp.stanford.edu/software/lex-parser.shtml#Download

但是我的输出不包含任何功能,并且 POS 不是 UD 的

1 拉 _ DD _ 2 空 _ _

2 pluie _ NN _ 3 NULL _ _

3 蝙蝠 _ VV _ 0 根 _ _

4 les _ DD _ 5 NULL _ _

5 carreaux _ NN _ 3 NULL _ _

我也在尝试使用 CoreNLP 的解析器工具,这是我的命令行:

java -mx1g -cp stanford-corenlp-3.7.0.jar:stanford-french-corenlp-2016-10-31-models.jar edu.stanford.nlp.pipeline.StanfordCoreNLP -props StanfordCoreNLP-french.properties -annotators tokenize,ssplit,pos,depparse -file /Users/Rafael/Desktop/LANGAGES/CORPUS/Sentences_FR/3aube_schtrouFR30.txt -outputFormat sortie.txt

我的属性文件包含以下几行:

注释器 = 标记化、分割、位置、解析

tokenize.language = fr

parse.model = edu/stanford/nlp/models/lexparser/frenchFactored.ser.gz

pos.model = edu/stanford/nlp/models/pos-tagger/french/french.tagger

depparse.model = edu/stanford/nlp/models/parser/nndep/UD_French.gz depparse.language = 法语

我收到以下错误消息

原因:java.io.IOException:无法将“edu/stanford/nlp/models/pos-tagger/french/french.tagger”作为类路径、文件名或 URL 打开

我该如何解决?

4

0 回答 0