python - 转换为 libsvm 格式之前的数据格式

翻译自：https://stackoverflow.com/questions/71335187 2022-03-03T09:57:47.723

18 次

在将它们转换为 libsvm 格式之前，我对、和数组的格式X有y疑问。query_id

因此，让我们举一个简短的例子。

最初，我在 Pandas 数据框中有特色文档（前 5 列）及其标签（最后一列; 1 = relevant, 0 = irrelevant），如下所示：

index  name  component   label
0      A     pink        0
1      B     orange      1
2      C     yellow      1
3      D     red         0

此外，我有两个查询：query1和query2。最初它们是两个字符串："this is query 1"和"this is query 2"分别。

这里的事情是前两行文档（样本）用于，query1最后两行用于query2。

我了解在转换为 libsvm 格式之前：

这个对吗？我的疑问是：

0 回答 0