2

我正在寻找一个基于句子的概念或含义进行 AI 文本摘要的引擎,我查看了诸如 (ginger, paraphrase, ace) 之类的开源项目,但它们没有完成这项工作。他们的工作方式是尝试为每个单词找到同义词并替换为当前单词,这样他们会生成很多句子的替代词,但大多数时候意思是错误的。

我曾与斯坦福大学的引擎合作,对一篇文章做一些亮点,并在此基础上提取最重要的句子,但这仍然不是抽象,而是它的提取。

我正在寻找的引擎会随着时间的推移而学习,并且每次总结后结果都会得到改善,这也是有道理的。

请在这里提供帮助,非常感谢您的帮助!

4

1 回答 1

2

我不知道任何符合您对抽象和含义的要求的开源项目,就像我假设的那样。

但我有一个想法如何构建这样的引擎以及如何训练它。

简而言之,我想我们都会在脑海中记住一些类似贝叶斯网络的结构,它不仅可以帮助我们对某些数据进行分类,还可以帮助我们形成关于文本或消息的抽象含义。

由于不可能从我们的脑海中提取所有抽象的类别结构,我认为最好建立一个允许逐步重建它的机制。

抽象的

所提出的解决方案的关键思想是使用更容易从自动化计算机系统操作的方法来提取对话的含义。这将允许创造与另一个人真实对话的良好水平的错觉。

提出的模型支持两个抽象级别:

首先,较不复杂的层次在于将词组或单个词识别为与类别、实例或实例属性相关的组。

实例是指从真实或抽象的主体、对象、动作、属性或其他类型的实例的一般类别中实例化。举个例子——两个或多个主体之间的具体关系:雇主和雇员之间的具体关系,具体的城市和它所在的国家等等。这种基本的含义识别方法使我们能够创建具有维持对话能力的机器人。这种能力基于对意义的基本要素的识别:类别、实例和实例属性。

其次,基于场景识别的最复杂的方法,将它们与实例/类别一起存储到对话上下文中,并使用它们来完成一些已识别的场景。

相关场景将用于完成对话的下一条消息,并且一些场景可用于生成下一条消息或通过使用条件和使用上下文中的含义元素来识别含义元素。

像这样的东西:

在此处输入图像描述

应手动输入基本分类,并在未来更正/添加教师。

对话中句子中的单词和句子中的场景可以从上下文中填充

对话场景/类别可以通过先前识别的实例或未来对话中描述的实例来完成(自学)

图 1 - 单词检测/分类基本上是流动视觉

图 2 – 通用系统视觉大图

图3-意义元素分类

图 4 - 基本上类别结构可能是这样的

于 2015-07-07T14:58:20.050 回答