问题标签 [sentence-transformers]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pytorch - 带有 MLM 问题的 Transformers 预训练 - 句子嵌入
我用我自己的未标记数据对变形器进行预训练,如下所示:
python train_mlm.py sentence-transformers/LaBSE train.txt
基于https://github.com/UKPLab/sentence-transformers/tree/master/examples/unsupervised_learning/MLM
然后我想获得 setnences 的嵌入。代码:
问题是我的输出形状类似于 (3, 14, 500 000)。如果没有对我的数据形状进行培训,则为 (3, 14, 768)。我做错了什么?训练后如何获得最终嵌入?
nlp - 模型解构的单词(分成多个标记)会影响准确性吗?
用例:句子相似度
不在词汇表中的词被模型解构并分解为子词和单字符标记。
问题
- 这会以任何方式影响模型的准确性吗?
- 添加新词汇是否对模型有任何帮助(优势)?
- 还有其他缺点吗?
有人可以解释一下吗?谢谢
例子
python - 使用 huggingface/transformers 预训练模型与 SentenceTransformer 的句子转换器
此页面有两个脚本
什么时候应该使用下面显示的第一种方法和第二种方法?作为nli-distilroberta-base-v2
专门用于查找句子嵌入的训练,这不会总是比第一种方法更好吗?
training_stsbenchmark.py1
-
training_stsbenchmark_continue_training.py
-
python - 句子转换器 - IndexError:维度超出范围(预计在 [-1, 0] 范围内,但得到 1)
我正在使用 kaggle 上的 sentence_transformers 库中的 DistilBERT,但是当我导入我的模型并尝试用它编码一个句子时:
我收到以下错误:
IndexError:维度超出范围(预计在 [-1, 0] 范围内,但得到 1)
python - sentence_transformers 如何创建文本 Python
我是语言模型培训的新手,希望有人能解释如何从经过训练的模型中实际生成文本。我在网上找到的任何示例代码都只是模型训练和打印嵌入。我不明白嵌入的重要性。我的目标是打印文本。例如,我在下面有这个示例代码。我可以使用此代码创建的模型来实际解释输入文本,而不仅仅是打印嵌入吗?
例如,我很想实现这样的目标:
“这是一个例句”
转换为
“这句话是一个例子”
或者
“杰克要去上学了”
至
“杰克在去学校的路上”
或类似的东西
python - 如何使用带有 dockerfile 的句子转换器下载和加载 ML 模型?
我们不想在运行时下载模型。取而代之的是,它应该在码头构建时下载。
那么,通过 docker 文件使用语句转换器下载模型的命令是什么?
如果我们能够下载它,那么我们如何使用 container/app.py 中的同一个库来加载它
你的回复对我很有帮助。如果有人知道相同的解决方案,请告诉我。
nlp - SBERT 的可解释性:我们能否更好地理解最终结果?
我熟悉 SBERT 及其预训练模型,它们很棒!但同时,我想了解结果是如何计算的,我在他们的网站上找不到更具体的内容。例如,我有一个文档,我想查找与它相似的其他文档。我使用了 2 个文档,每个文档包含 200-250 个单词(我将 model.max_seq_length 更改为 350,以便模型可以处理更大的文本),最后我们可以看到余弦相似度为 0.79。这就是我们所能看到的吗?有没有办法提取使模型返回这种高相似度值的主要短语/关键词?
提前致谢!
python - InvalidArgumentError:组件 0 处的数据类型不匹配:预期为双精度但得到 int32
我不适合模型变形金刚
结果
InvalidArgumentError:组件 0 处的数据类型不匹配:预期为 double 但得到 int32。
[[节点IteratorGetNext(定义在\KA6C9~1.ABE\AppData\Local\Temp/ipykernel_4340/3491990169.py:67)]] [Op:__inference_train_function_17352]
函数调用栈:train_function