问题标签 [vector-space]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
577 浏览

matlab - 如何在 Matlab 中表示向量的基?

我正在创建一个函数,它为向量空间提供两个基,它返回基矩阵从一个基到另一个基的变化。问题是我不知道如何表示一个基础。基基本上是一组向量(其中不可能重复)。

如何在 Matlab 中表示一个基础?我应该使用哪种数据结构?您可以提供不止一种可能性,但效率当然很重要,即使它现在是次要问题。

我是否应该简单地使用普通矩阵,例如列将代表基的向量?有更好的解决方案吗?

0 投票
2 回答
5708 浏览

javascript - Three.js - 如何围绕 Vector3 点旋转相机?

好的,我会尽量简洁。我对数学不是很好,对你来说似乎很明显的东西对我来说很可能是火箭科学。

我正在使用 Three.js w/CSS3DRenderer 创建一个虚拟画廊空间。

我需要第一人称视角,比如 FPS 游戏。

我已经成功地让相机向前、向后、向左和向右移动。

但是,当我去旋转相机时,我得到了结果如图所示

相机正在旋转其局部轴,但我需要的是viewport旋转,而不是相机,例如

如图所示

所以我需要的是让相机围绕一个枢轴点/矢量运行,然后通过使用重新聚焦Object3d.lookAt()

我知道我可以通过将相机作为另一个对象的子对象来解决我的问题,然后旋转对象的轴。但是,我宁愿自己做数学。

简而言之,我想了解如何围绕另一个矢量点旋转一个矢量点,以及如何以数学方式表示这种关系。

不想使用脚本(例如three.js pointer_lock 控件)来完成工作。我想弄脏实际的数学。

任何建议或教程链接将不胜感激!!!

0 投票
1 回答
255 浏览

neural-network - 为什么我们需要更大的向量空间来显示词嵌入模型中的关系?

我正在研究词嵌入,对词向量的维数有点困惑。我的意思是,以 word2vec 为例,我的问题是为什么我们应该为我们的隐藏层使用 100 个隐藏神经元?这个数字背后有什么意义或逻辑吗?或者如果它是任意的,为什么不是 300?还是10?为什么不多或少?众所周知,显示向量的最简单方法是在二维空间(只有 X 和 Y)上,为什么还要更多维呢?我阅读了一些有关它的资源,在一个示例中,他们选择了 100 个维度,在另一个示例中,他们选择了其他数字,例如 150、200、80 等。

我知道数字越大,显示单词之间关系的空间就越大,但是我们不能在二维向量空间(只有 X 和 Y)上显示关系?!为什么我们需要更大的空间?每个单词都由一个向量显示,那么当我们可以在 2 或 3 维空间上显示向量时,为什么我们必须使用高维空间呢?然后使用余弦之类的相似性技术来查找 2 或 3 维而不是 100 维(从计算时间的角度来看)的相似性更简单,对吧?

0 投票
1 回答
50 浏览

3d - 将 3D 矢量投影到面向对象中

因此,我目前正在尝试将 3D 矢量(从加速度计获得)投影到对象方向(通过整合从对象陀螺仪获得的角速度,返回为 3D 矢量)。但是我不确定该怎么做。

我现在正在使用 Excel 电子表格来了解我可以从测试数据中获得哪些结果,这些测试数据将被导入我正在使用的软件中。

0 投票
1 回答
233 浏览

python - 在弹性搜索中仅使用数字字段索引文档

我正在尝试将对象存储在仅由数字字段表示的弹性搜索中。在我的例子中,每个对象都有 300 个浮点字段和 1 个 id 字段。我已将 id 字段设置为 not_analyzed。我能够将文档存储在 ES 中。

但现在我想运行一个用相同的 300 个字段表示但数值不同的查询(当然)。现在我想找到其 300 个字段与此查询字段“最相似”的文档。所以这就像做余弦相似度,但我正在尝试使用 ES 来做这件事,以便它很快。

(1)首先,有没有可能做我正在做的事情?

(2) 其次,我探索了ES 的function_score功能并尝试使用它,但它返回最大匹配分数为 0.0!

关于我应该使用什么以及我在 [2] 中可能做错什么的任何评论。

0 投票
0 回答
149 浏览

tf-idf - 向量空间模型中的相似性度量

如果我有两个向量代表两个包含 Tf-IDF 权重的句子,如下所示:

v1 = [0.23,0.44,0.95,0.13]

v2 = [0.73,0.04,0.85,0.13]

传统(科学)度量是余弦相似度来度量它们之间的相似度,是否可以使用其他相似度度量来代替?

0 投票
1 回答
402 浏览

r - 如何在 R Studio 中将文本字段转换为 SVM 的数字/向量空间?

我正在尝试训练支持向量机来帮助检测字符串之间的相似性。我的训练数据由两个文本字段和一个包含 0 或 1 以表示相似性的第三个字段组成。最后一个字段是在编辑距离操作的帮助下计算的。我知道在继续之前我需要将两个文本字段转换为数值。我希望找出实现这一目标的最佳方法是什么?

训练数据如下所示:

我一直在尝试使用text2vec库,使用这个有用的小插图作为指南。这样做,我大概可以表示向量空间中的一个字段。

  • 但是我怎样才能使用这个库来同时管理两个文本字段呢?
  • 我应该将两个字符串字段连接成一个字段吗?
  • text2vec是最好的方法吗?

将用于管理其中一个字段的代码:

0 投票
1 回答
2493 浏览

python - 如何在 Gensim Word2Vec 中手动更改单词的向量维度

我有一个带有很多词向量的 Word2Vec 模型。我可以这样访问一个词向量。

输出

现在我有一个合适的向量表示,我想用它替换 word_vectors['boy']。

但是会抛出以下错误

有什么时尚或解决方法可以做到这一点吗?那是在训练模型后手动操作词向量吗?是否可以在除 Gensim 之外的其他平台上使用?

0 投票
1 回答
786 浏览

python - 使用 plt.quiver

如何将 matplotlib 箭头或 quiver 与如下列表一起使用:

目的是在 Xlim 的同一帧中绘制从 (X,Y) 到 (U,V) 的箭头,Ylim = (30,30)。

我在互联网上看到的示例,使用网格来制作箭袋。有什么提示吗?

0 投票
2 回答
4672 浏览

normalization - 在使用余弦相似度之前,是否有任何理由(不)对向量进行 L2 归一化?

我正在阅读 Levy 等人的论文“Improving Distributional Similarity with Lessons Learned from Word Embeddings”,在讨论他们的超参数时,他们说:

向量归一化 (nrm)如第 2 节所述,所有向量(即 W 的行)都归一化为单位长度(L2 归一化),使点积运算等效于余弦相似度。

然后我回忆起sim2R 包中向量相似度函数的默认值text2vec首先是 L2 范数向量:

所以我想知道,这可能是什么动机,规范化余弦(无论是在 text2vec 方面还是在一般方面)。我试图阅读 L2 范数,但主要是在使用欧几里得距离之前的规范化背景下出现的。在词向量空间/嵌入的余弦相似度的情况下,我无法(令人惊讶地)找到任何关于 L2 范数是否会被推荐或反对的任何信息。而且我不太具备计算分析差异的数学技能。

所以这是一个问题,意味着在从文本数据中学习的词向量空间的上下文中(可能只是由 tfidf、ppmi 等加权的共现矩阵;或像 GloVe 之类的嵌入),并计算词相似度(目标是当然要使用最能反映现实世界单词相似性的向量空间+度量)。
简而言之,在计算向量/单词之间的余弦相似度之前,是否有任何理由(不)在单词特征矩阵/术语共现矩阵上使用 L2 范数?