166

到目前为止,我已经弄清楚了如何导入文件、创建新文件和随机化列表。

我无法从列表中随机选择 50 个项目来写入文件?

def randomizer(input,output1='random_1.txt',output2='random_2.txt',output3='random_3.txt',output4='random_total.txt'):

#Input file 
    query=open(input,'r').read().split()
    dir,file=os.path.split(input)

    temp1 = os.path.join(dir,output1)
    temp2 = os.path.join(dir,output2)
    temp3 = os.path.join(dir,output3)
    temp4 = os.path.join(dir,output4)


    out_file4=open(temp4,'w')

    random.shuffle(query)

    for item in query:
        out_file4.write(item+'\n')   

所以如果总随机化文件是

example:

random_total = ['9','2','3','1','5','6','8','7','0','4']

我想要 3 个文件(out_file1|2|3),第一个随机集 3,第二个随机集 3,第三个随机集 3(对于这个例子,但我想创建的应该有 50)

random_1 = ['9','2','3']
random_2 = ['1','5','6']
random_3 = ['8','7','0']

所以最后的“4”将不包括在内,这很好。

如何从我随机化的列表中选择 50 个?

更好的是,我如何从原始列表中随机选择 50 个?

4

5 回答 5

349

如果列表是随机顺序的,您可以只取前 50 个。

否则,使用

import random
random.sample(the_list, 50)

random.sample帮助文本:

sample(self, population, k) method of random.Random instance
    Chooses k unique random elements from a population sequence.

    Returns a new list containing elements from the population while
    leaving the original population unchanged.  The resulting list is
    in selection order so that all sub-slices will also be valid random
    samples.  This allows raffle winners (the sample) to be partitioned
    into grand prize and second place winners (the subslices).

    Members of the population need not be hashable or unique.  If the
    population contains repeats, then each occurrence is a possible
    selection in the sample.

    To choose a sample in a range of integers, use xrange as an argument.
    This is especially fast and space efficient for sampling from a
    large population:   sample(xrange(10000000), 60)
于 2013-03-19T22:03:19.690 回答
49

选择随机项目的一种简单方法是洗牌然后切片。

import random
a = [1,2,3,4,5,6,7,8,9]
random.shuffle(a)
print a[:4] # prints 4 random variables
于 2016-10-25T06:01:07.517 回答
38

我认为random.choice()是一个更好的选择。

import numpy as np

mylist = [13,23,14,52,6,23]

np.random.choice(mylist, 3, replace=False)

该函数从列表中返回一个由 3 个随机选择的值组成的数组

于 2016-09-20T04:37:10.317 回答
2
  1. 我们有 3 个样本(“橙色”、“芒果”、“苹果”)。创建的系列,应包含 7 个元素并从列表中随机选择。

    随机选择
    import random
    
    import numpy as np
    
    fruits = ['orange','mango','apple']
    
    np.random.choice(fruits, 7, replace=True)
    

    输出

    array(['orange', 'mango', 'apple', 'orange', 'orange', 'mango', 'apple'],
          dtype='<U6')
    
  2. 从列表中随机选择(少于 3 个值)

    随机抽样
    import random
    
    random.sample(fruits, 3)
    
于 2021-07-15T13:01:26.840 回答
-3

假设您的列表有 100 个元素,并且您想以随机方式选择其中的 50 个。以下是要遵循的步骤:

  1. 导入库
  2. 为随机数生成器创建种子,我把它放在 2
  3. 准备一个数字列表,以随机方式从中提取
  4. 从数字列表中随机选择

代码:

from random import seed
from random import choice

seed(2)
numbers = [i for i in range(100)]

print(numbers)

for _ in range(50):
    selection = choice(numbers)
    print(selection)
于 2018-08-13T12:17:44.607 回答