1

我正在考虑生成具有有趣分布的测试数据。

我了解生成均匀分布和正态分布的方法,但是如何将任意函数转换为加权分布函数?我的术语可能不在此处-我不介意更正。

例如,假设我有一个函数随着时间的推移通常会增加,但会周期性地循环。“活动”通常会在一年内增加,但每周周期会在周末急剧下降。

该函数可以是代数的,但如果它可以是任何函数(命令式(?)具有离散/不连续范围(?)),那将是有价值的。

如果示例中的 Activity 曲线是f(t),我可以只取平均值并提供固定的标准差,但如果它也需要分布f(t),我该如何选择?t我不想遍历T,我只想T在适当的分布中随机选择。

因此,TestActivityGenerator() 函数采用绝对日期范围、一周内的另一条曲线和一天中数小时内的另一条曲线之间的曲线参数,并以适当的分布吐出 DateTimes。结果不是按任何特定顺序生成的。

另一种情况可能是:一个实数生成器,比方说,输出素数的可能性是复合数的 1.652 倍。这个没有技巧 - 有一些简单的方法可以做到这一点,但我正在寻找一个通用的解决方案。

谢谢!

编辑:我已经更改了标题的措辞以从不同的角度看待问题 - 我们如何从最佳拟合曲线回溯到与该曲线一致的随机样本。如果我有股票市场数据的直方图,我如何生成与真实数据分布相似的数据。不仅仅是成对的值,每个 的平均值都相同t,因为它们会通过其他随机性测试。

4

0 回答 0