我有如下数据:
col1 col2 col3
2 14 text, text, some text
我浏览了http://scikit-learn.org/stable/modules/preprocessing.html#preprocessing但我只能找到对 col3 进行矢量化并将其传递给分类的信息。在我的场景中,我在 col1 和 col2 中也有数字信息。
如果没有矢量化我通过 col1、2 和 3,我会收到 col3 的错误,因为它是字符串。
如果我对 col3 进行矢量化,则输出是一个稀疏矩阵。我需要将 col1 和 col2 添加到矢量化数据中。我怎么做?
我正在使用 scikit-learn。