2

我正在尝试将一个列表拆分为 n 个子列表,其中每个子列表的大小是随机的(至少有一个条目;假设P>I)。我使用了 numpy.split 函数,它工作正常,但不满足我的随机性条件。您可能会问随机性应该遵循哪种分布。我想,应该没关系。我检查了几篇不等同于我的帖子的帖子,因为它们试图用几乎相同大小的块进行拆分。如果重复,请告诉我。这是我的方法:

import numpy as np

P = 10
I = 5
mylist = range(1, P + 1)
[list(x) for x in np.split(np.array(mylist), I)]

P当不能被 整除时,这种方法就失效了I。此外,它创建大小相等的块,而不是概率大小的块。另一个限制:我不想使用这个包random,但我对numpy. 不要问我为什么;我希望我有一个合乎逻辑的回应。

根据疯狂科学家提供的答案,这是我尝试的代码:

P = 10
I = 5

data = np.arange(P) + 1
indices = np.arange(1, P)
np.random.shuffle(indices)
indices = indices[:I - 1]
result = np.split(data, indices)
result

输出:

[array([1, 2]),
 array([3, 4, 5, 6]),
 array([], dtype=int32),
 array([4, 5, 6, 7, 8, 9]),
 array([10])]
4

2 回答 2

3

该问题可以重构为I-1从中选择随机分割点{1,2,...,P-1},可以使用星形和条形来查看。

因此,可以如下实现:

import numpy as np

split_points = np.random.choice(P - 2, I - 1, replace=False) + 1
split_points.sort()
result = np.split(data, split_points)
于 2019-09-13T01:05:00.860 回答
2

np.split仍然是要走的路。如果传入一个整数序列,split会将它们视为切点。生成随机切割点很容易。你可以做类似的事情

P = 10
I = 5

data = np.arange(P) + 1
indices = np.random.randint(P, size=I - 1)

你想要I - 1切割点来获得I块。需要对索引进行排序,并且需要删除重复项。 np.unique两者都适合你。你最终可能会以这种方式得到少于I块:

result = np.split(data, indices)

如果您绝对需要I数字,请选择不重新采样。例如,可以通过以下方式实现np.shuffle

indices = np.arange(1, P)
np.random.shuffle(indices)
indices = indices[:I - 1]
indices.sort()
于 2019-09-12T23:45:58.663 回答