我有网络问题。对于一份文件,我正在提取一些信息。我正在为他们绘制漂亮的图表。但在一个文件中信息流。我试图用图表来描述它,就像一个人阅读文本的方式,然后是最重要的实体,然后是下一个重要的实体。
为了理解和掌握这个问题,我必须研究哪些类型的东西,或者网络理论或图论的哪个方面处理它。
如果有人可以请参考。注册,SK。
我有网络问题。对于一份文件,我正在提取一些信息。我正在为他们绘制漂亮的图表。但在一个文件中信息流。我试图用图表来描述它,就像一个人阅读文本的方式,然后是最重要的实体,然后是下一个重要的实体。
为了理解和掌握这个问题,我必须研究哪些类型的东西,或者网络理论或图论的哪个方面处理它。
如果有人可以请参考。注册,SK。
首先,我不是语言或语言研究方面的专家。我想我理解你想要做什么,但我不知道最好的方法是什么。
如果我猜对了,你想为你的话确定一些中心性度量(这将解释社交网络参考),找到那些与他人联系最密切的人,是吗?
如果你尝试这样做,问题是你肯定会发现最中心的词是最有趣的词(the, if, then, 一些多余的形容词......),如果你不事先应用标记化和词形还原过程。因此,您只能将所用动词的名词和词干分开,然后只有您可以尝试您的方法。
您必须记住的另一个问题是,单词的存在和稀有性都很重要(例如,参见 tf-idf weight measure)。
最后,我在 google 上进行了以下搜索:
《n gram 图语言中心性词》
并发现这篇论文似乎对您的要求很有趣(我可能会自己看一下!):