问题标签 [nlg]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - 如何使用 Open-AI GPT 构建特定领域的语言模型以生成自然语言?
我想使用 Open-AI GPT 构建自己的语言模型。如何使用 Open-AI GPT 构建特定领域的语言模型以生成自然语言?
python - NLTK MLE 模型澄清三元组及更多
我正在学习 NLTK,并且对数据预处理和 MLE 模型有疑问。目前我正在尝试使用 MLE 模型生成单词。问题是当我选择 n>=3 时。我的模型会产生完全正常的单词,直到它到达一个句点('.')。之后,它只会输出句尾填充。
这基本上就是我正在做的事情。
我怀疑我的问题的答案在于我为模型准备 n-gram 的方式。那么有没有一种方法来格式化/准备数据,例如,三元组是这样生成的——>( . , </s>, <s> )
这样模型会尝试再次开始另一个句子并输出更多的单词?
还是有另一种方法可以避免我上面写的问题?
nlp - 与 Microsoft Bot Framework 一起使用自然语言生成
我需要帮助来了解是否使用具有任何 NLG 功能的 MS bot 框架开发了任何用例。我知道 LUIS 有 NLP 和 NLU,但没有 NLG。
Azure 聊天机器人是使用图灵-NLG 等任何 NLG 开发的吗?
python - 如何预训练统一语言模型(UniLm)
我正在做一个非英语项目,为此,我需要在上NLP
重新训练,但他们没有指定如何在他们的 GitHub 存储库中进行训练。UniLm
bert-base-multilingual-cased
任何帮助表示赞赏!
node.js - 用于生成可读文件名的长句缩短器
我正在寻找一种缩短句子(几行文本)以产生“可读”(不太长)文件名的方法。
应用场景是一个聊天机器人,用户可以在其中提交媒体,比如视频,以及一些配对的描述文本(标题)。应用程序会为视频分配一个可读的文件名,然后通过他的文件名检索视频。
想象一个视频与或多或少的场景长文本描述配对,例如:
我怎样才能用“合适的”短文件名来缩短上面的描述?
好的,我可以把这个句子作为一个名字,也许有点净化,比如:
但这样我可以超过文件名大小的 255 限制(例如在 Linux 上)
对缩短算法有什么想法吗?也许我可以用单词缩写来构建缩短的文件名?也许我可以从句子文章、介词等中删除?
顺便说一句,一个小问题:我正在使用意大利语,因此需要对字符进行一些清理才能生成好的文件名。
最后但并非最不重要的一点是,我正在寻找 JavaScript/Node.js 代码
python - ModuleNotFoundError:没有名为“tensorflow.contrib”的模块,tensorflow=2.0.0
我正在使用 TensorFlow version=2.0.0 python version=3.7.3 我正在尝试导入以下语句
它给出了错误,因为模块“tensorflow”没有属性“contrib”我该如何解决这个问题?
python - TypeError:“NLP”对象不可调用
从这里我只是尝试运行现场提供的示例代码,但我收到了这个错误
----> 1 text = nlp("Virginica 物种的平均萼片宽度最小。")
TypeError:“NLP”对象不可调用
我已经安装了所有软件包,但仍然可能导致此问题的原因是什么?
nlp - 如何通过无监督方法学习数据到文本 NLG 中的语义对齐?
我是数据到文本 NLG 的新手。我正在研究数据到文本中的语义对齐,任务定义是用数据表的键标记关于数据故事的参考文本段,如下图所示。
现在的困难是没有标记数据,所以我不知道如何处理它。所以我想知道有没有关于这个问题的论文或方法。谢谢!
python - 测量语法文本质量的模型
我通过转换器模型生成文本,我正在寻找一种测量语法文本质量的方法。喜欢文字:"Today is a good day. I slept well and got up good in the morning."
应该被评为高于:"Yesterday I went into bed and. got Breakfast son."
是否有任何模型可以完成我以前没有找到的这项工作,或者有没有其他方法可以衡量文本语法输出的质量?
我发现,spacy可以选择显示文本是否有语法错误,但我更感兴趣的是包含文本长度和错误数量的分数。我还研究了 NLTK 的可读性,但这旨在了解文本的理解程度,这不仅仅取决于语法。
谢谢!
python - 如何仅从单词中生成有意义的句子?
我想从单词列表中生成一个句子。我尝试过 n-gram 模型,但它只从已经存在的句子生成文本,即我们输入一个句子,它根据 n 的值输出下一个生成的单词。哪个模型将有助于仅从单词列表中生成有意义的句子,以及应该使用哪个数据集来训练模型?