我有一个格式的边缘列表:
Product_B Consumer_Id_1
Product_B Consumer_Id_2
Product_A Consumer_Id_3
我想将其用于 scikit learn 中基于项目的过滤,为此我需要将其转换为稀疏的 scipy 矩阵,其中每一行或每一列代表一个标题的特征向量,如果消费者购买或没有购买,则为 1 或 0那个标题。
scipy 上的文档让我感到奇怪的困惑。如何在不显式旋转 numpy 或 pandas 中的数组的情况下构造稀疏矩阵?
先感谢您!