如果我们做文档的信息可视化,跨多个文档的图生成往往会形成一个网格。现在为了得到一个清晰的画面,很容易以最小的数据负载形成它们,因此总结是一件好事。但是,如果文档负载变为百万,那么通过汇总,图形也会形成一个大网格。我有点困惑如何清除网格。阅读和工作http://www.jerrytalton.net/research/Talton04SSMSA.report/Talton04SSMSA.pdf并没有太大帮助,因为数据量很大。
如果有任何博学的成员可以帮助我。
问候, SK
如果我们做文档的信息可视化,跨多个文档的图生成往往会形成一个网格。现在为了得到一个清晰的画面,很容易以最小的数据负载形成它们,因此总结是一件好事。但是,如果文档负载变为百万,那么通过汇总,图形也会形成一个大网格。我有点困惑如何清除网格。阅读和工作http://www.jerrytalton.net/research/Talton04SSMSA.report/Talton04SSMSA.pdf并没有太大帮助,因为数据量很大。
如果有任何博学的成员可以帮助我。
问候, SK
您是在谈论创建文档的图形或网络吗?例如,您可以通过引用、共享作者、出现相同的术语等来链接文档网络。这通常不称为网格问题,而是自动图形布局问题。
您需要更好的布局算法或进行某种聚类和缩减。您可以使用许多聚类算法,例如 Wakita & Tsurumi 的:
Navlakha 等人特别针对通过“图形摘要”降低复杂性。2008 年:
您还可以查看我的最新论文,它用代表性字形替换了网络中常见的重复模式:
这是可能减少的示例图片: