问题标签 [sentence-transformers]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

45 问题

0 投票

1 回答

48 浏览

pytorch - 带有 MLM 问题的 Transformers 预训练 - 句子嵌入

我用我自己的未标记数据对变形器进行预训练，如下所示：

python train_mlm.py sentence-transformers/LaBSE train.txt 基于https://github.com/UKPLab/sentence-transformers/tree/master/examples/unsupervised_learning/MLM

然后我想获得 setnences 的嵌入。代码：

问题是我的输出形状类似于 (3, 14, 500 000)。如果没有对我的数据形状进行培训，则为 (3, 14, 768)。我做错了什么？训练后如何获得最终嵌入？

2021-12-28T12:30:12.113

0 投票

0 回答

15 浏览

nlp - 模型解构的单词（分成多个标记）会影响准确性吗？

用例：句子相似度

不在词汇表中的词被模型解构并分解为子词和单字符标记。

问题

这会以任何方式影响模型的准确性吗？
添加新词汇是否对模型有任何帮助（优势）？
还有其他缺点吗？

有人可以解释一下吗？谢谢

例子

nlp tokenize huggingface-tokenizers sentence-similarity sentence-transformers

2022-01-07T13:45:12.580

0 投票

0 回答

13 浏览

machine-learning - RuntimeError: Found dtype Long but expected Float When fit SBERT Model

我正在编写代码来训练 sbert 进行分类。当我尝试使用 lossname == 'cosinus' 运行代码时，我收到了这个 Dtype 错误。当我使用 lossname == 'rank' 运行代码时，它运行良好。我不知道为什么我会收到这个错误。任何帮助都将是可观的。

'''

**运行时错误**

machine-learning nlp loss-function bert-language-model sentence-transformers

2022-01-09T10:49:17.450

0 投票

1 回答

137 浏览

python - 使用 huggingface/transformers 预训练模型与 SentenceTransformer 的句子转换器

此页面有两个脚本

什么时候应该使用下面显示的第一种方法和第二种方法？作为nli-distilroberta-base-v2专门用于查找句子嵌入的训练，这不会总是比第一种方法更好吗？

training_stsbenchmark.py1 -

training_stsbenchmark_continue_training.py-

python nlp bert-language-model sentence-transformers

2022-01-10T22:54:21.337

0 投票

1 回答

110 浏览

python - 使用有限访问互联网的句子转换器

我可以访问最新的软件包，但我无法从我的 python 环境访问互联网。

我拥有的软件包版本如下

我去了该位置并复制了文件夹中的所有文件

然后我转到url并尝试执行那里列出的代码

但我得到以下错误

我在哪里可以获得这 4 个文件 ( 'pytorch_model.bin', 'tf_model.h5', 'model.ckpt.index', 'flax_model.msgpack') 或者我还需要更改什么？这些文件在上述第一个 URL 中不可用

python nlp huggingface-transformers sentence-transformers

2022-01-14T21:26:41.533

0 投票

0 回答

21 浏览

python - 句子转换器 - IndexError：维度超出范围（预计在 [-1, 0] 范围内，但得到 1）

我正在使用 kaggle 上的 sentence_transformers 库中的 DistilBERT，但是当我导入我的模型并尝试用它编码一个句子时：

我收到以下错误：

IndexError：维度超出范围（预计在 [-1, 0] 范围内，但得到 1）

python nlp bert-language-model sentence-transformers

2022-02-05T08:57:20.357

0 投票

1 回答

29 浏览

python - sentence_transformers 如何创建文本 Python

我是语言模型培训的新手，希望有人能解释如何从经过训练的模型中实际生成文本。我在网上找到的任何示例代码都只是模型训练和打印嵌入。我不明白嵌入的重要性。我的目标是打印文本。例如，我在下面有这个示例代码。我可以使用此代码创建的模型来实际解释输入文本，而不仅仅是打印嵌入吗？

例如，我很想实现这样的目标：

“这是一个例句”

转换为

“这句话是一个例子”

或者

“杰克要去上学了”

至

“杰克在去学校的路上”

或类似的东西

python model huggingface-transformers sentence-transformers

2022-02-07T09:42:39.823

0 投票

0 回答

14 浏览

python - 如何使用带有 dockerfile 的句子转换器下载和加载 ML 模型？

我们不想在运行时下载模型。取而代之的是，它应该在码头构建时下载。

那么，通过 docker 文件使用语句转换器下载模型的命令是什么？

如果我们能够下载它，那么我们如何使用 container/app.py 中的同一个库来加载它

你的回复对我很有帮助。如果有人知道相同的解决方案，请告诉我。

python docker dockerfile sentence-transformers

2022-02-15T17:59:50.330

0 投票

0 回答

17 浏览

nlp - SBERT 的可解释性：我们能否更好地理解最终结果？

我熟悉 SBERT 及其预训练模型，它们很棒！但同时，我想了解结果是如何计算的，我在他们的网站上找不到更具体的内容。例如，我有一个文档，我想查找与它相似的其他文档。我使用了 2 个文档，每个文档包含 200-250 个单词（我将 model.max_seq_length 更改为 350，以便模型可以处理更大的文本），最后我们可以看到余弦相似度为 0.79。这就是我们所能看到的吗？有没有办法提取使模型返回这种高相似度值的主要短语/关键词？

提前致谢！

nlp transformer sentence-transformers

2022-02-16T19:37:23.120

0 投票

0 回答

7 浏览

python - InvalidArgumentError：组件 0 处的数据类型不匹配：预期为双精度但得到 int32

我不适合模型变形金刚

结果

InvalidArgumentError：组件 0 处的数据类型不匹配：预期为 double 但得到 int32。

[[节点IteratorGetNext（定义在\KA6C9~1.ABE\AppData\Local\Temp/ipykernel_4340/3491990169.py:67）]] [Op:__inference_train_function_17352]

函数调用栈：train_function

python sentence-transformers

2022-02-17T14:58:46.370

1 2 3 4 5 6 7 8 9 10

问题标签 [sentence-transformers]

Reference