我试图弄清楚使用 Syntaxnet 可以在长文档的文本分析中获得哪些改进,而不是像字数、句子长度等“愚蠢”的东西。
目标是获得更准确的语言度量(例如“语气”或“复杂性”),以量化较长(更)文档(如报纸文章或信件/备忘录)的属性。
我想弄清楚的是,一旦 POS 标记结束,如何处理 Syntaxnet 输出。人们使用什么类型的东西来处理 Syntaxnet 输出?
理想情况下,我正在寻找一个示例工作流,将 Syntaxnet 输出转换为可用于统计分析的定量数据。
另外,有人能指出我的来源,显示从使用 Syntaxnet 的“智能”分析中得出的推论与通过字数、句子长度等可以获得的推论相比如何?