0

我有网络问题。对于一份文件,我正在提取一些信息。我正在为他们绘制漂亮的图表。但在一个文件中信息流。我试图用图表来描述它,就像一个人阅读文本的方式,然后是最重要的实体,然后是下一个重要的实体。

为了理解和掌握这个问题,我必须研究哪些类型的东西,或者网络理论或图论的哪个方面处理它。

如果有人可以请参考。注册,SK。

4

1 回答 1

1

首先,我不是语言或语言研究方面的专家。我想我理解你想要做什么,但我不知道最好的方法是什么。

如果我猜对了,你想为你的话确定一些中心性度​​量(这将解释社交网络参考),找到那些与他人联系最密切的人,是吗?

如果你尝试这样做,问题是你肯定会发现最中心的词是最有趣的词(the, if, then, 一些多余的形容词......),如果你不事先应用标记化和词形还原过程。因此,您只能将所用动词的名词和词干分开,然后只有您可以尝试您的方法。

您必须记住的另一个问题是,单词的存在和稀有性都很重要(例如,参见 tf-idf weight measure)。

最后,我在 google 上进行了以下搜索:

n gram 图语言中心性词

并发现这篇论文似乎对您的要求很有趣(我可能会自己看一下!):

LexRank:基于图的词汇中心性作为文本摘要中的显着性

于 2013-01-18T08:04:18.610 回答