我目前正在使用 Wapiti 来检测网页中的特定产品名称。我已经训练了一个模型,我想列出这个模型中最重要的 10 条规则(那些权重最大的规则(正面或负面))。
以下是从 Wapiti 文档中获取的训练模型示例:
[...]
12:*:Pre-3 X='s,
13:*:Pre-3 X=Wel,
13:*:Suf-3 X=rid,
[...]
10=-0x1.32892bf985df3p-1
11=0x1.73883325ee8edp-4
15=0x1.034d12a224d71p-2
16=-0x1.1fa154002a2f9p+0
那么,从以上 3 条规则中,我怎么知道哪条的权重最大呢?该规则*:Pre-3 X='s,
与数字“12”相关联。这个数字是重量吗?还是对下面几行的引用?但是,数字“12”没有出现在这些行中。
另一个问题:是否可以强制“硬约束”?也就是说,要编写一个规则,即每当看到一个观察时,它总是会产生一个给定的标签。