0

我有如下数据:

col1   col2   col3
 2      14    text, text, some text

我浏览了http://scikit-learn.org/stable/modules/preprocessing.html#preprocessing但我只能找到对 col3 进行矢量化并将其传递给分类的信息。在我的场景中,我在 col1 和 col2 中也有数字信息。

如果没有矢量化我通过 col1、2 和 3,我会收到 col3 的错误,因为它是字符串。

如果我对 col3 进行矢量化,则输出是一个稀疏矩阵。我需要将 col1 和 col2 添加到矢量化数据中。我怎么做?

我正在使用 scikit-learn。

4

0 回答 0