0

二元相关性是一种众所周知的处理多标签分类问题的技术,我们为特征的每个可能值训练一个二元分类器:

http://link.springer.com/article/10.1007%2Fs10994-011-5256-5

另一方面,一个热编码器 (OHE) 常用于自然语言处理中,用于对将多个值作为二进制向量的分类特征进行编码:

http://cs224d.stanford.edu/lecture_notes/LectureNotes1.pdf

我们可以认为这两个概念是同一个概念吗?还是有技术差异?

4

1 回答 1

3

两种方法都不一样。

1. One-Hot编码

one-hot encoding中,考虑了向量。 在此处输入图像描述

上图表示二元分类问题。

2.二元相关性

在二元相关中,我们不考虑向量。下图表示使用使用标量值的二进制相关方法生成类标签。

在此处输入图像描述

于 2016-08-08T12:16:10.980 回答