问题标签 [question-answering]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
363 浏览

rasa-nlu - 当我只有域内数据时,如何在特定于域的问答机器人中评估域外问题?

我了解到,一些流行的机器人(如 RASA 或 LUIS)将具有“置信度分数”来评估域外问题,但它们都没有提供有关如何计算这些分数的文档。此外,信息检索有一些计算相似度的方法,但我不知道它将使用哪些方法进行域外分类。有人能给我一些关于我可以研究哪些论文、方向或代码的想法吗?

0 投票
1 回答
1069 浏览

python - 如何使用 tensorflow 为 BERT SQuAD2.0 的保存模型构建输入以进行预测

鉴于我已经获得了输入的所有元素,我正在尝试从 BERT-SQuAD 为保存的模型构建输入。

我通过在Google bert中运行 run_squad.py 来微调问答模型,然后使用 export_saved_model 导出模型。现在,当我有一个新的上下文和问题时,我无法构建可以从模型中获得返回输出的正确输入。

导出模型的代码:

我加载模型的方式:

我从 run_squad.py 获得了 eval_features。我尝试构建输入的方式:

我希望得到一个“输出”预测,以便从中提取问题的答案。

我得到的回溯:

0 投票
1 回答
627 浏览

machine-learning - 作为多类分类的问答的损失函数?

我正在处理一个数据有限(大约 10,000 个数据点)和上下文/问题以及选项/选择的特征很少的问答问题。鉴于:

  • 一个问题 Q 和

  • 选项 A、B、C、D、E(每个都以某些特征为特征,例如与 Q 的字符串相似性或每个选项中的单词数)

  • (在训练时)一个正确的答案,比如 B。

我希望准确地预测其中之一作为正确答案。但我被困住了,因为:

  1. 如果我将 ground truth 排列为 [0 1 0 0 0],并给出 QABCDE 的串联作为输入,那么模型将表现得好像将图像分类为狗、猫、大鼠、人、鸟,即每个类都有一个意思,但是这里不是这样。如果我将输入切换到 QBCDEA,预测应该是 [1 0 0 0 0]。

  2. 如果我将每个数据点分成 5 个数据点,即 QA:0、QB:1、QC:0、QD:0、QE:0,那么模型无法得知它们实际上是相互关联的,并且只有其中一个它们必须被预测为 1。

一种似乎可行的方法是创建一个自定义损失函数,它会惩罚单个问题的多个 1,并且也会惩罚没有 1。但我想我可能在这里遗漏了一些非常明显的东西:/

我也知道像 BERT 这样的大型模型是如何在像数据集这样的 SQuAD 上做到这一点的。他们为每个选项添加位置嵌入(例如,A 得到 1,B 得到 2),然后使用 QA1 QB2 QC3 QD4 QE5 上的一种连接作为输入,并将 [0 1 0 0 0] 作为输出。不幸的是,鉴于我拥有的数据集非常小,我相信这在我的情况下不起作用。

0 投票
2 回答
1027 浏览

python - 将从给定的信息/文档中回答的聊天机器人

我想制作一个聊天机器人,它将根据给定的文档回答问题。例如,如果我有数百个文档,我想从中获取一些信息,但不知道哪些信息在页面的哪一行,所以我必须花费一些时间和精力去搜索。我想要一个聊天机器人,它可以从这些文档中学习并从这些文档中给出答案。

有没有可以满足我需求的可用服务?

如果我想自己制作模型怎么办?我需要哪些工具/库才能使它成为可能?

任何帮助将不胜感激。

0 投票
2 回答
58 浏览

time-complexity - 关于时间复杂度的一个有趣问题

在课堂上,我向老师提出了这个问题,他无法回答,这就是我在这里问的原因。我问在代码中,如果我们有一个从 1 到 10 的循环运行,复杂度会是 O(1) {big O of 1} 吗?他回答是的。所以这里的问题是,如果我编写了一个从 1 到 100 万运行的循环,它会是 O(1) 吗?或者是 O(n) 还是别的什么?

伪代码 - 对于范围内的 i(1,100,000):打印(“嘿”)

该循环的时间复杂度是多少

现在,如果你认为答案是 O(n) ,你怎么能说它是 O(n) ,因为 O(n) 是复杂性是线性的。什么是一线希望?当代码得到 O(1) 和 O(n) 时。就像我会为 10 或 100 或 1000 或 10000 或 100000 编写一个循环一样。它何时从 O(1) 转换为 O(n)。

0 投票
1 回答
132 浏览

nlp - 计算问答对之间相关性分数的方法是什么?

在信息检索或问答系统中,我们使用 TD-IDF 或 BM25 计算问题-问题对的相似度得分作为深度学习的基线或粗略排名。

在社区问答中,我们已经有了问答对来收集一些统计信息。如果没有深度学习,我们是否可以发明像 BM25 这样的算法来计算问答对的相关性分数?

有哪些方法可以做到?

0 投票
1 回答
83 浏览

list - haskell 中的值构造函数

我有一个关于 Haskell 的问题。我是新手,所以我不太了解,但是如果有人可以帮助我,我将不胜感激。我从我买的一本书中得到了这个练习。

使用值构造器SimNao创建类型Question。创建一个函数:

  • listQuest:从参数接收问题列表,并为Nao返回0 ,或为Sim返回1 ,对应列表中的构造函数。

我试过这段代码:

我迷失在迅速的事情中。不知道写什么来使用这个功能。

谢谢您的帮助

0 投票
1 回答
37 浏览

python - 询问动态问题以获取信息

我正在开发一个聊天机器人,它会询问用户数据库中不存在的信息。

考虑数据库有每个人的 40 个详细信息:姓名、年龄、最喜欢的食物、最喜欢的餐厅、最喜欢的城市、最喜欢城市的原因、城市中最喜欢的四个东西等。

所以,问题可以是“我们叫什么名字?” “你为什么喜欢巴黎?” “说出你最喜欢巴黎的四个地方吗?”

等等

我希望这些问题由机器人即时生成,但不知道如何用英语表达这些问题。任何帮助或方向(研究论文/图书馆/代码等)将不胜感激。

0 投票
5 回答
6851 浏览

c++ - 智能手机Codechef问题逻辑混乱

您正在开发智能手机应用程序。您有一个应用程序的潜在客户列表。每个客户都有预算,当且仅当价格低于或等于客户的预算时,他们才会以您声明的价格购买应用程序。

您想确定一个价格,以使您从应用程序中获得的收入最大化。找到这个最大可能的收入。

例如,假设您有 4 个潜在客户,他们的预算是 30、20、53 和 14。在这种情况下,您可以获得的最大收入是 60。

我的朋友告诉我,只需对数组进行排序并尝试使用

ar[i]*(ni) 虽然我实现了我没有理解整个逻辑。真的需要帮助解释

0 投票
1 回答
277 浏览

python - 问答+NLP中的问题生成

我有一个数据集(大约 3K 到 4K)excel 文件,每个文件都有大约 12K 条记录,这些记录是常见问题解答、电子邮件对话、博客评论、聊天等的组合。

最好的部分是,它有两列,一列用于Questions,另一列用于Answers

来自 excel 的一个示例记录 - (注意 -无法公开客户数据,因此我自己只创建一个记录来解释场景)。

例如。示例问题 -What are IIT colleges in India?

示例答案 -The Indian Institutes of Technology (IITs) are autonomous public institutes of higher education, located in India. They are governed by the Institutes of Technology Act, 1961 which has declared them as institutions of national importance and lays down their powers, duties, and framework for governance. The Institutes of Technology Act, 1961 lists twenty-three institutes.Each IIT is autonomous, linked to the others through a common council (IIT Council), which oversees their administration. The Minister of Human Resource Development is the ex officio Chairperson of the IIT Council. As of 2018, the total number of seats for undergraduate programs in all IITs is 11,279.

客户的要求是——

从(以上示例答案)段落中生成尽可能多的简单问题及其答案,并将其附加到同一个 Excel 中。

(然后,他将通过将其输入到生成聊天机器人故事的某些工具中来进一步处理每个 excel)。

例如。

  • IIT 是自主的吗?(答案Yes:)
  • 什么管理 IIT?(答案The Institutes of Technology Act, 1961:)
  • IIT位于哪个国家/地区?(答案India:)
  • 1961 年《技术学院法》列出了多少个机构?(答案:)twenty-three等。

答案生成我可以使用 AllenAI 来完成,但不确定如何生成问题?我尝试了一个repo,但它看起来不完整,需要更多的努力,因为我是 NLP 或 ML 的新手,所以不知道如何进行这些更改。

在问答中生成问题有什么帮助吗?

我可以在现有语言模型(例如 spacy 的模型)之上创建任何模型来生成实体然后生成问题吗?