2

我有一个像这样的框架:

x = sf.SFrame({'users': [{'123': 1.0, '122': 5},
{'134': 3.0, '123': 10}]})

我想在不调用 graphlab create 的情况下转换为 scipy.sparse csr_matrix,而只使用 sframe 和 Python。

怎么做?

4

1 回答 1

0

假设您希望行号成为输出稀疏矩阵中的行索引,唯一棘手的步骤是使用SFrame.stack- 从那里您应该能够csr_matrix直接构造一个。

import sframe as sf
from scipy.sparse import csr_matrix

x = sf.SFrame({'users': [{'123': 1.0, '122': 5},
                         {'134': 3.0, '123': 10}]})
x = x.add_row_number('row_id')
x = x.stack('users')
A = csr_matrix((x['X3'], (x['row_id'], x['X2'])), 
               shape=(2, 135))

我还在这里对矩阵的维度进行了硬编码,但这可能是您想要通过编程方式解决的问题。

于 2016-01-26T19:07:49.983 回答