我一直在研究 Google 的 word2vec 模型。我能够为文本词语料库生成最大 300 维的向量。这是一个非常令人印象深刻的工具,并且在大数据上的准确性更进一步。
我很好奇,有什么方法可以使用 word2vec 在灰度图像上生成向量。我确信方法是相同的,您根据像素强度生成向量,然后计算余弦相似度。
我正在尝试建立一个模型来计算灰度图像上的相似距离。除了适用于文本的 word2vec 或 glove 之外,任何库都能够做到这一点?
我一直在研究 Google 的 word2vec 模型。我能够为文本词语料库生成最大 300 维的向量。这是一个非常令人印象深刻的工具,并且在大数据上的准确性更进一步。
我很好奇,有什么方法可以使用 word2vec 在灰度图像上生成向量。我确信方法是相同的,您根据像素强度生成向量,然后计算余弦相似度。
我正在尝试建立一个模型来计算灰度图像上的相似距离。除了适用于文本的 word2vec 或 glove 之外,任何库都能够做到这一点?
我同意你的观点,word2vec 是一个非常令人印象深刻的工具,但是这个模型是通过预测一些文章或新闻中的下一个词来训练的。总而言之,我认为在图像上使用 word2vec是没有意义的。
您可以使用skimage进行一些图像测量。例如skimage-measure
Word2vec 不是一个很好的图像模型,但是我认为你真正需要的是一个word model 包。在图像比较的基本方法中,您将图像转换为关键点特征列表(例如 SIFT、SURF 等),然后将点簇相互匹配(例如FLANN)。
图像中的大量特征和每个点表示的不确定性使得很难使用基本的一层网络学习,例如 word2vec 进行图像识别。您可能会在本教程中找到更好的示例。
3 年后更新:我还应该提到 ConvNets 和几个现在可用的预训练模型,您可以从像素中提取视觉特征。