我正在使用 Stanford POS-tagger 应用程序在大约 300 个文件中标记一些文章。为此,我编写了一个 C# 代码,它将遍历文件并使用标记器。
我的代码如下所示:
Process thisProcess=new Process();
thisProcess.StartInfo.CreateNoWindow=true;
thisProcess.StartInfo.WindowStyle=ProcessWindowStyle.Hidden;
thisProcess.StartInfo.WorkingDirectory=@"C:\postagger";
thisProcess.StartInfo.FileName=@"C:\postagger\stanford-postagger.bat";
thisProcess.StartInfo.UseShellExecute=false;
thisProcess.StartInfo.RedirectStandardOutput=true;
if(Directory.Exists(@"C:\brown2")) {
DirectoryInfo brown=new DirectoryInfo(@"C:\brown2");
DirectoryInfo brownParsed;
if(!Directory.Exists(@"C:\brown-parsed"))
brownParsed=Directory.CreateDirectory(@"C:\brown-parsed");
else
brownParsed=new DirectoryInfo(@"C:\brown-parsed");
FileInfo[] files=brown.GetFiles();
foreach(FileInfo f in files) {
Console.WriteLine("Parsing file "+f.Name+" ...");
thisProcess.StartInfo.Arguments=@"C:\postagger\models\wsj-0-18-bidirectional-distsim.tagger "+f.FullName;
//Console.WriteLine(thisProcess.StartInfo.Arguments);
thisProcess.Start();
thisProcess.WaitForExit();
//Console.Read();
StreamWriter sw=new StreamWriter(Path.Combine(brownParsed.FullName, f.Name), false);
string output=thisProcess.StandardOutput.ReadToEnd();
//sw.Write(thisProcess.StandardOutput.ReadToEnd());
sw.Write(output);
sw.Flush();
sw.Close();
//Console.WriteLine("File {0} done!",f.Name);
Console.WriteLine(output);
}
}
else
Console.WriteLine("Dir not found!");
Console.Read();
stanford-postagger.bat 看起来像这样:
用法:stanford-postagger 模型文本文件 例如,stanford-postagger models\left3words-wsj-0-18.tagger sample-input.txt
java -mx300m -cp "stanford-postagger.jar;" edu.stanford.nlp.tagger.maxent.MaxentTagger -model %1 -textFile %2
问题是:
代码运行它,但它不会运行 java 命令。我在我的笔记本电脑上试过了,它就像一个魅力,它标签。但由于内存不足,它不会标记大文件。但是在我更强大的PC上,它不会运行java。
如果我打开 CMD 并输入带有文件正确参数的 java 命令,它就可以工作。有什么可能导致它不起作用的想法吗?所有的路径都很好,我检查了三次。
这是我从非工作程序(在我的 PC 上)获得的输出示例:
C:\postagger>java -mx300m -cp "stanford-postagger.jar;" edu.stanford.nlp.tagger.maxent.MaxentTagger -model C:\postagger\models\wsj-0-18-bidirectional-distim.tagger-textFile C:\brown2\aaa.txt