问题标签 [rasa-nlu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-web-services - 使用 MITIE 和 Rasa 加速模型训练
我正在使用 Rasa 中的 MITIE 后端训练一个用于识别短的、一到三个句子字符串的模型。该模型使用 spaCy 进行训练和工作,但它并不像我想要的那样准确。spaCy 的培训不超过五分钟,但 MITIE 的培训在我拥有 16GB RAM 的计算机上不间断地运行了几天。因此,我开始在具有 255GB RAM 和 32 个线程的 Amazon EC2 r4.8xlarge 实例上对其进行训练,但它似乎并未使用所有可用资源。
在 Rasa 配置文件中,我有num_threads: 32
和 set max_training_processes: 1
,我认为这将有助于使用所有可用的内存和计算能力。但现在它已经运行了几个小时,CPU 使用率处于 3%(100% 使用率,但仅在一个线程上),内存使用率保持在 25GB 左右,是可能的十分之一。
你们有没有尝试加速 MITIE 培训的经验?我的模型有 175 个意图和总共 6000 个意图示例。Rasa 配置文件中有什么需要调整的吗?
rasa-nlu - Rasa NLU 中的跟进和意图
任何人都可以澄清如何配置后续意图或提示,如 api.ai 吗?我正在尝试使用 rasa nad spacy 作为后端创建类似于 api.ai 的应用程序。
rasa-nlu - Rasa nlu 解析请求给出错误的意图结果
Rasa NLU 版本(例如 0.7.3):0.10.0a6
使用的后端/管道(mitie,spacy_sklearn,...):["nlp_spacy", "tokenizer_spacy", "intent_featurizer_spacy","ner_crf", "ner_synonyms", "intent_classifier_sklearn","ner_spacy"]
操作系统(windows、osx、...):Windows server 2012 R2
问题:我已经安装了 Rasa nlu 0.10.0a6 版本。我的confi_spacy 文件看起来像。
我的数据文件看起来像。
使用上面的配置和 json 数据,我已经使用低于 HTTP 端点训练了 Rasa
/train?project=项目
在使用训练数据创建的一个项目文件夹中训练数据后。
我用下面的命令启动了 Rasa 服务器。
python -m rasa_nlu.server -c config_spacy.json
现在服务器从端口 5000 启动。
当我可以执行 '/parse?q=hello&project=Project' 解析端点得到低于响应。
当我可以执行 '/parse?q=Great choice&project=Project' 时,解析端点低于响应。
当我可以执行 '/parse?q=Great choice&Project=Project' 时,解析端点低于响应。
当我可以执行“/parse?q=Book a cab&project=Project”时,解析端点低于响应。
以这种方式,对于每个请求,它有时会以正确的结果响应,有时则不会。如果您可以在这两个响应中观察 Parse_reponce2.txt 和 Parse_reponce3.txt,由于此更改,我刚刚从小“p”更改为“项目”中的大写“P”,每个请求我得到不同的结果。
在经过训练的数据中,没有“预订出租车”文本或任何相关意图。但是,当我使用此文本发送解析时,我没有得到无意图,它正在返回意图结果。对于任何随机的任何解析请求都没有得到无意图。
这是我的培训问题还是出了什么问题。请让我知道如何获得正确的意图结果以及实体结果。
配置文件的内容(如果使用且相关):
docker - 如何配置要为 dockerized Rasa-NLU 公开的端口
我是 Rasa 和 docker 的新手。我对 Rasa-NLU 进行 dockerize 的尝试包括以下步骤: 说明是从这里引用的
- 做了最新 Rasa-NLU 的 Git 克隆
- 复制
Dockerfile_full
(从内部/docker
)到根目录 config_default.json
将指定的端口号Dockerfile_full
从默认(5000)更改为 5048。构建使用:
docker build -t rasa_nlu .
在不同于默认 (5000) 端口的端口 (5048) 上运行 docker。
但是,控制台中会记录以下内容:
INFO:rasa_nlu.data_router:Logging requests to '/app/logs/rasa_nlu_log-20170928-091903-1.log'.
INFO:__main__:Started http server on port 5000
2017-09-28 09:19:03+0000 [-] Log opened.
2017-09-28 09:19:03+0000 [-] Site starting on 5000
2017-09-28 09:19:03+0000 [-] Starting factory <twisted.web.server.Site instance at 0x7fbab0bfdd40>
如果我尝试使用 CURL 在本地访问 Rasa 端点,则会收到connection reset
错误消息。当在 docker 容器中检查时(使用docker exec
)它在端口 5000 上运行,我对被引用的错误端口的怀疑得到了证实。
有人可以帮我看看我到底哪里出错了,应该在哪里配置端口号?
提前致谢!
nlp - 我的模型找不到任何实体
我正在测试 NLP 工具,现在我遇到了 Rasa NLU 的问题。
使用 API.AI、Wit.ai 和 LUIS.AI,我可以在不超过 8-10 个示例的情况下找到我想要的实体。另一方面,对于 Rasa,我已经有 18 个示例,但我永远找不到实体。即使我的查询与我的一个示例完全匹配,我仍然有一个空的实体数组作为结果。
我将 Rasa 与推荐的 Docker 实例一起使用,我当前的管道是["nlp_spacy", "tokenizer_spacy", "intent_featurizer_spacy", "ner_crf", "ner_synonyms", "intent_classifier_sklearn" and "ner_duckling"]
.
我在查询中指定我的项目和模型,如下所示:
localhost:5000/parse?q=my_sentence&project=my_project&model=my_model
任何有用的信息表示赞赏。谢谢!
更新示例
然后,例如,当我尝试从“我需要什么来制作巧克力蛋糕?”中提取信息时。(也作为示例列出)这是结果:
{"entities": [], "intent": {"confidence": 0.8870822891508189, "name": "AskRecipe"}, "text": "What do I need to make brownies?", "intent_ranking": [{"confidence": 0.8870822891508189, "name": "AskRecipe"}, {"confidence": 0.11291771084918109, "name": "greet"}]}
我尝试了许多其他示例,但没有一个有效。
python - NLP 的 MITIE 库
我试图了解 MITIE 如何与 Rasa 集成。我想知道 MITIE 文件 total_word_feature_extractor.dat 到底包含什么?我没有找到任何关于此的好的文档。
谢谢!
python - 训练 MITIE ner 模型的数据集
是否有任何带有标记实体的现有数据集来训练 MITIE ner 模型?我检查了链接,https://github.com/mit-nlp/MITIE/blob/master/examples/python/train_ner.py,它只用两个样本训练模型。是否有任何带有标记实体的现有数据集进行训练?
python - MITIE ner 模型
我一直在探索使用预训练的 MITIE 模型进行命名实体提取。无论如何我可以查看他们的实际 ner 模型而不是使用预训练模型吗?该模型是否可作为开源提供?
python - 在 Windows 上安装 rasa
我正在尝试在 Windows 10 上安装 rasa。我已经安装了 Python 3.6 和 pip。当我运行pip install rasa_nlu
时,我收到以下错误:
我已经尝试了大多数解决方案,例如重新安装 Microsoft 可再发行组件、安装构建工具等,但它们都没有奏效。
rasa-nlu - Rasa-core,插槽未填充
我正在尝试rasa-core
通过 nlu 解释器创建简单的打印机支持聊天机器人,机器人应该获取打印机型号和打印机类型并发布问题。
我在插槽和实体中使用了打印机模型和打印机类型变量,但插槽没有从聊天字符串中填充。
请帮助我。