您好有一个带有两个命名空间的 Vowpal Wabbit 文件,例如:
1.0 |A snow |B ski:10
0.0 |A snow |B walk:10
1.0 |A clear |B walk:10
0.0 |A clear |B walk:5
1.0 |A clear |B walk:100
1.0 |A clear |B walk:15
使用 -q AB,我可以获得交互项。有什么办法让我只保留交互项而忽略线性项?
换句话说,vw sample.vw -q AB --invert_hash sample.model
现在的结果是这样的:
....
A^clear:24861:0.153737
A^clear^B^walk:140680:0.015292
A^snow:117127:0.126087
A^snow^B^ski:21312:0.015803
A^snow^B^walk:28234:-0.010592
B^ski:107733:0.015803
B^walk:114655:0.007655
Constant:116060:0.234153
我希望它是这样的:
....
A^clear^B^walk:140680:0.015292
A^snow^B^ski:21312:0.015803
A^snow^B^walk:28234:-0.010592
Constant:116060:0.234153
--keep 和 --ignore 选项不会产生预期的效果,因为它们似乎是在生成二次项之前考虑的。是否可以使用 vw 执行此操作,或者我是否需要创建所有组合的自定义预处理步骤?