我知道如何执行一个并行循环joblib
,返回一个列表作为结果。
但是,是否可以numpy
并行填充预定义的矩阵?
想象一下以下最小的示例矩阵和数据:
column_data = ['a', 'b', 'c', 'd', 'e', 'f', 'x']
data = [['a', 'b', 'c'],
['d', 'c'],
['e', 'f', 'd', 'x']]
x = np.zeros((len(data), len(column_data))
请注意,这column_data
是已排序且唯一的。data
是列表的列表,而不是矩形矩阵。
循环:
for row in range(len(data)):
for column in data[row]:
x[row][column_data.index(column)] = 1
可以并行化这个循环吗?在没有并行化的情况下填充70,000 x 10,000
矩阵非常慢。