0

我有一些技术文档,我需要从中提取有关一组特定程序的文本。是否有一种简单的现成方法来“显示”语言模型要提取的文本和每个文档,然后让它以编程方式提取该文本?

我正在考虑获取每个段落并取段落中所有单词嵌入的平均值来创建“段落嵌入”,并将其与训练集提取文本的“段落嵌入”进行比较,但我不知道是否有一种更强大的方法可以做到这一点。

4

0 回答 0