2

我正在对 2 个不同的集合运行上下文强盗方法,这些集合仅在动作变量上有所不同。我在 (klaster3.model) 上构建模型的一组具有 6 种不同的动作类型,而我也在其上构建模型的另一组 (klaster8.model) 具有 7 种不同的动作类型。

当我 head testLabels -n 1 | vw -i klaster8.model -t -p /dev/stdout --quiet 在命令行中运行这样的一行时,我会得到 5.000000 Mloda_kobieta 看起来像是从该上下文的策略中选择的操作。

但是,当我使用 (audit) 选项尝试相同的代码时,-a我会收到这样的输出:

0.943965 Mloda_kobieta Constant:142055:1:0.50745 ^K:136407:1:0.236886 ^Young:101199:1:0.199628 0.994175 Mloda_kobieta Constant:142056:1:0.488827 ^K:136408:1:0.281023 ^Young:101200:1:0.224326 0.948740 Mloda_kobieta Constant:142057:1:0.482498 ^K:136409:1:0.2568 ^Young:101201:1:0.209442 0.979921 Mloda_kobieta Constant:142058:1:0.497253 ^K:136410:1:0.241421 ^Young:101202:1:0.241247 0.910945 Mloda_kobieta Constant:142059:1:0.506602 ^K:136411:1:0.208468 ^Young:101203:1:0.195875 1.004143 Mloda_kobieta Constant:142060:1:0.49813 ^K:136412:1:0.280554 ^Young:101204:1:0.225459 0.934807 Mloda_kobieta Constant:142061:1:0.494118 ^K:136413:1:0.240735 ^Young:101205:1:0.199954 0.953710 Mloda_kobieta Constant:142048:1:0.582269 ^K:136400:1:0.213502 ^Young:101192:1:0.15794 0.994442 Mloda_kobieta Constant:142049:1:0.526175 ^K:136401:1:0.243671 ^Young:101193:1:0.224595 0.944228 Mloda_kobieta Constant:142050:1:0.504455 ^K:136402:1:0.22308 ^Young:101194:1:0.216693 0.979964 Mloda_kobieta Constant:142051:1:0.521737 ^K:136403:1:0.233687 ^Young:101195:1:0.22454 0.907704 Mloda_kobieta Constant:142052:1:0.547686 ^Young:101196:1:0.186401 ^K:136404:1:0.173617 1.004132 Mloda_kobieta Constant:142053:1:0.549014 ^K:136405:1:0.247787 ^Young:101197:1:0.207331 0.937724 Mloda_kobieta Constant:142054:1:0.525254 ^K:136406:1:0.236784 ^Young:101198:1:0.175686 5.000000 Mloda_kobieta

这看起来像是对这种情况下的某种动作评分,在我看来,应该选择得分最低的动作(本例中的动作 5)。我想知道为什么有 14 行,而我在这个数据集中只有 7 种不同的动作类型?以及为什么当我有 6 种不同的操作类型时会收到 12 行。它看起来像 number_of_different_acion_types*2。就我而言,只有两个解释变量,年龄和性别。

问题是:

1) 带有审计 (-a) 的输出中的行数是否对应于等式:number_of_different_acion_types*number_of_explanatory_variables

2)如果是,前 7 行(在该示例中)是否对应于第一个变量,而其他 7 行对应于第二个变量?

3)如何知道输出的顺序是什么?哪个变量被视为第一个变量,哪个变量被视为第二个变量?它是否对应于输入数据集中的列顺序?

4)如果前 7 行对应于第一个变量的成本系数,其他 7 行对应于第二个变量的成本系数,输出策略是否选择这些系数总和最小的臂/动作?(每个动作有 2 个系数,因为有 2 个变量)。

我怀疑输出的顺序对应于输入中列的顺序,但我不确定。

感谢您的回答。

4

0 回答 0