math - 社交网络查询的幂律曲线拟合

Question

Twitter 最近宣布，您可以通过在以下公式中输入他们的关注者数量来高精度地估计任何给定 Twitter 用户的排名：

exp($a + $b * log(follower_count))

其中 $a=21 和 $b=-1.1

这显然比按给定用户的关注者数量对整个用户列表进行排序要有效得多。

如果您有来自不同社交网站的类似数据集，您如何导出 $a 和 $b 的值以适合该数据集？基本上是一些频率列表，其分布被假定为幂律。

score 6 · Accepted Answer

您有以下型号：

y = exp(a + b.log(x))

这相当于：

log(y) = a + b.log(x)

因此，如果您记录您的数据集，您最终会得到一个线性模型，因此您可以使用线性回归a来确定和的最佳拟合值b。

然而，这一切对我来说听起来毫无意义。谁说给定的网络站点使用这种关系来确定用户排名？

score 1 · Accepted Answer

您可以使用名为“Solver”的 Microsoft Excel 加载项。它包含在 Excel 中，但并非总是默认安装。在您的 Excel 版本中查找“加载项”和“求解器”并加载它。

安装插件后，执行以下操作：

2 回答 2