问题标签 [power-law]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
101 浏览

python - 使用 powerlaw python 包区分随机 gnp 图和优先附件 grpah

我的目标是使用powerlaw python 包找到无标度网络与随机(非无标度)网络无法区分的点

正如他们的论文中所述,人们应该始终通过将其与另一个分布的拟合进行比较来确定幂律拟合的优劣。

我希望实现类似二项分布的东西来比较拟合优度,但事实并非如此。

例如,我尝试使用以下代码来区分明显无标度的网络和明显的非无标度网络(两者都具有相似数量的节点/边):

输出表明,没有一个已实现的分布提供了区分优先附件模型和 gnp 随机图的工具:

(第一个值的符号表示第一个(正)或第二个(负)分布是否更适合,第二个值是该决策显着性的 p 值)

我是从错误的角度解决这个问题,还是应该自己实现二项分布?

我在问,因为我不是统计专家,我可能看不到所有可用分布的重要性。但他们似乎未能通过这个基本示例。

0 投票
1 回答
1435 浏览

python - 比较幂律与其他分布

我正在使用 Jeff Alstott 的 Python 幂律包来尝试将我的数据拟合到幂律。Jeff 的软件包基于 Clauset 等人的论文,该论文讨论了幂律。

首先,关于我的数据的一些细节:

  1. 它是离散的(字数数据);
  2. 它严重向左倾斜(高偏度)
  3. 它是Leptokurtic(过度峰度大于 10)

到目前为止我做了什么

df_data 是我的数据框,其中 word_count 是一个包含大约 1000 个单词标记的单词计数数据的系列。

首先,我生成了一个fit对象:

接下来,我使用 fit.distribution_compare(distribution_one, distribution_two) 方法将我的数据的幂律分布与其他分布(即lognormalexponentiallognormal_positivestretched_exponentialtruncated_powerlaw )进行比较。

作为 distribution_compare 方法的结果,我为每个比较获得了以下 (r,p) 元组:

  • fit.distribution_compare('power_law', 'lognormal') = (0.35617607052907196, 0.5346696007)
  • fit.distribution_compare('power_law', 'exponential') = (397.3832646921206, 5.3999952097178692e-06)
  • fit.distribution_compare('power_law', 'lognormal_positive') = (27.82736434863289, 4.2257378698322223e-07)
  • fit.distribution_compare('power_law', 'stretched_exponential') = (1.37624682020371, 0.2974292837452046)
  • fit.distribution_compare('power_law', 'truncated_power_law') =(-0.0038373682383605, 0.83159372694621)

从幂律文档:

R:浮动

两组可能性的对数似然比。如果为正,则第一组可能性更有可能(因此产生它们的概率分布更适合数据)。如果为负,则反之亦然。

p : 浮动

R 符号的显着性。如果低于临界值(通常为 0.05),则认为 R 的符号显着。如果高于临界值,则 R 的符号被认为是由于统计波动。

从幂律分布、指数分布和对数正态分布的比较结果来看,我倾向于说我有幂律分布。

这是对测试结果的正确解释/假设吗?或者也许我错过了什么?

0 投票
1 回答
1890 浏览

python-3.x - 使用python和networkx求概率密度函数

我正在努力为我在网上找到的 Facebook 数据绘制幂律图。我正在使用 Networkx,并且我已经找到了如何绘制学位直方图和学位等级的方法。我遇到的问题是我希望 y 轴是一个概率,所以我假设我需要总结每个 y 值并除以节点总数?谁能帮我做到这一点?一旦我得到了这个,我想画一个对数对数图,看看我是否能得到一条直线。如果有人可以提供帮助,我将不胜感激!这是我的代码:

0 投票
0 回答
29 浏览

foursquare - 如何求用户签到的分布概率?

我读过一篇论文,提到用户的签到行为遵循幂律分布。我想知道如何计算用户的签到行为?

在此处输入图像描述

这是概率图,他们说:

为了获得此测量值,我们计算用户签入的所有 POI 对之间的距离,并在同一用户签入的 POI 距离上绘制直方图(实际上是概率密度函数)。如图 2 所示,同一用户签到的大部分 POI 对似乎都在短距离内,这表明用户签到活动中存在地理聚集现象。 7

0 投票
0 回答
173 浏览

r - 我们可以通过使用 qqplot(使用 R)找出分布是否遵循幂律分布?

我想知道给定的分布是否遵循幂律。我的问题是,我们可以用一个qq情节来做到这一点吗?

我首先通过整合整个数据集来估计 xmin。之后,我使用 MLE 找到了 alpha。(xmin 和 alpha 在以下链接中进行了解释:- https://en.wikipedia.org/wiki/Power_law 在幂律概率分布部分下)

接下来我计划使用经验分布和理论分布的 qqplot(计算出的 alpha 和 xmin)。

我在正确的轨道上吗?

另外,在幂律的情况下应该使用什么参考线(对应于qqline)?

我们还可以使用对数图来确定分布是否遵循幂律。我的问题是,qqplot 分析会增强 log log plot 分析吗?对幂律分布进行 qqplot 分析是否有效?

0 投票
2 回答
2423 浏览

python - 如何执行多条曲线的联合拟合(在 Python 中)?

假设我通过简单的线性回归拟合一些数据点。现在我想对几组数据点执行几个联合线性回归。更具体地说,我希望一个参数在所有拟合中相等,此处示意性地描述了 y 轴交点。

y轴交点

在谷歌搜索了一段时间后,我既找不到任何 Python (Scipy) 例程,也找不到任何一般文献,如何做到这一点。

理想情况下,我不仅希望在简单线性回归的情况下执行这些联合拟合,而且还希望在更一般的拟合函数中执行这些联合拟合(例如,幂律与联合指数拟合)。

0 投票
1 回答
740 浏览

gnuplot - 在 gnuplot 中使用破幂律拟合数据

我想用破幂律函数拟合我的数据。我正在使用来自两个不同文件的数据,这是我用来在 gnuplot 工具中拟合我的数据的代码

但我的配件看起来像这样:

在此处输入图像描述

是我使用功能错误的方式还是其他原因?

0 投票
1 回答
448 浏览

python - 用已知指数拟合幂律并在 Python 中提取系数

我有一个数据集,我知道它适合以下形式的曲线:

我想提取a.

在 Python 中解决这个问题的最佳方法是什么(使用 scipy 等)?

0 投票
0 回答
110 浏览

c# - 使用 Unity / C# 的征费行走 / 幂律分布

我想创建一些基于征费飞行的随机游走的人工智能。我目前让他们以完全随机的方式移动(最小值和最大值之间的随机距离,以及最小值和最大值之间的随机等待时间)。我知道 Levy 航班从幂律分布中汲取了这两种忧郁。我知道我需要以某种方式从幂律分布中获取每个步长,但 C# 只有一个随机函数,它取自均匀分布。我不知道如何从 C# 中的幂律分布中获取值。我怎样才能做到这一点?

我是一个编程新手,所以请让你的回答尽可能接近 Layman 的!

0 投票
1 回答
47 浏览

r - 如何在估算 powRlaw 的 xmin 时修复“m$getDat() 中的错误:尝试应用非功能”

我正在尝试将幂律分布拟合到一些样本数据。我正在尝试使用该estimate_xmin()函数查找 xmin 。有谁知道为什么我在尝试应用非功能时会出错?

错误信息: