我已经阅读了这个答案,这可能是在 Python 中随机化字符串列表的最佳方式。我只是想知道这是否是最有效的方法,因为我通过以下代码获得了大约 3000 万个元素的列表:
import json
from sets import Set
from random import shuffle
a = []
for i in range(0,193):
json_data = open("C:/Twitter/user/user_" + str(i) + ".json")
data = json.load(json_data)
for j in range(0,len(data)):
a.append(data[j]['su'])
new = list(Set(a))
print "Cleaned length is: " + str(len(new))
## Take Cleaned List and Randomize it for Analysis
shuffle(new)
如果有更有效的方法可以做到这一点,我将不胜感激有关如何做到这一点的任何建议。
谢谢,