给定加权有向图的邻接矩阵 A(因此矩阵元素不只是 0/1 并且矩阵不是对称的),是否有任何预测新边的好方法?
我有一个非常大(数十亿个节点)的数据集,其中一些连接的已知边缘和未观察到的连接的 NULL 值,我想使用已知边缘来预测未观察到的边缘。
如果方法不精确,那很好——事实上,如果预测低于某个阈值,我想将边保持为 NULL 或 0,只是为了保持矩阵尽可能稀疏以适应数据大小和处理速度。
有什么想法吗?
给定加权有向图的邻接矩阵 A(因此矩阵元素不只是 0/1 并且矩阵不是对称的),是否有任何预测新边的好方法?
我有一个非常大(数十亿个节点)的数据集,其中一些连接的已知边缘和未观察到的连接的 NULL 值,我想使用已知边缘来预测未观察到的边缘。
如果方法不精确,那很好——事实上,如果预测低于某个阈值,我想将边保持为 NULL 或 0,只是为了保持矩阵尽可能稀疏以适应数据大小和处理速度。
有什么想法吗?
您可能希望深入研究随机图生成和图挖掘文献,尤其是在无标度网络上的工作。快速的互联网搜索产生了一些可能相关的论文。
现实世界动态网络的概述,包括它们的属性、合适的模型和分析技术。
这篇调查文章侧重于可在合成图生成中利用的真实图的属性。
本文解决了作者声称在大型现实世界图中经常出现的致密化和直径缩小问题。引用了测试用例。
本文专门处理生成合成社交网络图。
将给定的参考文献视为有些武断的选择。我希望有大量相关资源。
我自己的一些粗略的高级想法:您是否有任何关于实际图表的(统计)属性、权重的聚合度量或其统计分布的信息?你有关于你的抽样策略属性的任何信息(特别是偏见)吗?你的观察是否有时间标记?
如果您有统计模型,请查看最大似然估计。如果您到目前为止只有观察到的连接,并且您可以假设它们是独立同分布的,您可以将引导方法应用于您的观察集以估计图形属性的统计信息(例如,度数/的均值/方差/等)连通性/周长/重量等)。根据所讨论的度量,这条轨道可能是矫枉过正的——假设你的观察集没有偏差,而是从给定的图表中计算度量。
将此信息输入随机图生成器,该生成器允许使用启动图进行初始化。
希望这个大纲有所帮助,尽管它很模糊。此致。