2

我试图找出一种方法可以将 Facebook 用户表示为向量。我决定将用户的不同属性/参数堆叠到一个大向量中(即年龄是一个大小为 100 的向量,其中 100 是您可以拥有的最大年龄,如果您说 50,则前 50 个值向量将是 1,就像温度计一样)。我只是想不出一种将 Facebook 兴趣表示为向量的方法,它们是单词的集合,代表所有单词的空间很大,我不能像一袋单词或相似的东西。有谁知道我应该如何进行?我对此仍然很陌生,任何参考将不胜感激。

如果希望对这个问题投反对票,请让我知道它有什么问题,以便我可以改进措辞和上下文。

谢谢

4

1 回答 1

2

“正确”的方法取决于您的学习算法是什么以及决策问题是什么。

但是,将年龄表示为单个数字特征而不是 100 个指标特征通常会更好。这样,学习算法就不必学习这一百个特征之间的关系(它是内置的),并且问题的维度减少了 99 个,这将使一切变得更好。

为了对兴趣进行建模,您可能希望从一个极高维的词袋模型开始,然后使用各种选项之一来降低维度:

于 2012-04-20T18:23:59.423 回答