vowpalwabbit - 无法反转哈希以获取带有矩阵分解的 vowpal wabbit 中的特征名称

翻译自：https://stackoverflow.com/questions/34666519 2016-01-07T22:39:28.510

315 次

--invert_hash 适用于回归模型，但是当我激活矩阵分解时，--readable_model 和--invert hash 的输出是相同的。我想查看每个用户或项目的潜在变量，但无法将它们与项目/用户的名称匹配。这个可重现的小样本并没有向您展示我的所有完整数据集，而是说明了这个问题：

#bash
echo "5 |u user1 |i item1
1 |u user1 |i item2
5 |u user2 |i item2
1 |u user2 |i item1" | vw -f test.vwbin --rank 2 

echo "5 |u user1 |i item1
1 |u user1 |i item2
5 |u user2 |i item2
1 |u user2 |i item1" | vw -t -i test.vwbin --invert_hash test.vwih

less test.vwih

结果如下所示：

Version 7.7.0
Min label:0.000000
Max label:5.000000
bits:18
0 pairs:
0 triples:
rank:2
lda:0
0 ngram:
0 skip:
options:
0 0.026660 0.029663 0.066095 0.001638 0.024027
1 0.004046 0.004133 0.001141 0.035247 0.077151
2 0.071812 0.048789 0.009294 0.078689 0.055306
... (and so on until line 262143)

这些行都不包含字符串“user1”、“user2”、“item1”或“item2”。我错过了什么吗？

还有一个问题，我在文档中找不到答案 - 为什么每个事件有 5 个潜在变量，因为 rank=2？

vowpalwabbit - 无法反转哈希以获取带有矩阵分解的 vowpal wabbit 中的特征名称

0 回答 0

Related

Reference