我目前正在尝试对文本进行分类。我的数据集太大,正如这里所建议的,我需要使用稀疏矩阵。我现在的问题是,将元素添加到稀疏矩阵的正确方法是什么?例如,假设我有一个矩阵 X 这是我的输入。
X = np.random.randint(2, size=(6, 100))
现在这个矩阵 X 看起来像一个 ndarray 的 ndarray (或类似的东西)。
如果我做
X2 = csr_matrix(X)
我有稀疏矩阵,但是如何向稀疏矩阵添加另一个元素?例如这个密集元素: [1,0,0,0,1,1,1,0,...,0,1,0] 到稀疏向量,如何将它添加到稀疏输入矩阵?
(顺便说一句,我对 python、scipy、numpy、scikit ......一切都很陌生)