Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
给定一个具有非均匀分布(高峰值)的数据集,我想重新采样以创建一个具有近似均匀分布的新数据集。我的做法:
有没有更好的技术?
我们知道,对于均匀分布,我们有
平均值 = (a+b) / 2
方差 = (ba)^2 / 12
因此,您可以构建这些并使用这些参数从均匀分布中采样,您可以设置 a = min(data) 和 b = max(data) 或者 a = mean(lowest_bin) 和 b = mean(highest_bin) 或其他东西像那样。你想如何设置 a 和 b 取决于你的数据和你想要完成的事情