问题标签 [knowledge-base-population]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - NLTK 关系提取不返回任何内容
我最近正在研究使用 nltk 从文本中提取关系。所以我建立了一个示例文本:“汤姆是微软的联合创始人。” 并使用以下程序测试并返回任何内容。我不知道为什么。
我正在使用 NLTK 版本:3.2.1,python 版本:3.5.2。
这是我的代码:
1.经过一些调试,如果发现当我将输入更改为
“盖茨于 1955 年 10 月 28 日出生于华盛顿州西雅图。”
nltk.chunk.ne_chunk() 输出为:
(S (PERSON Gates/NNS) 出生于/VBD/VBN 在/IN (GPE Seattle/NNP) ,/, (GPE Washington/NNP) on/IN October/NNP 28/CD ,/, 1955/CD ./。 )
test() 返回:
[PER: 'Gates/NNS'] '是/VBD 出生/VBN 在/IN' [GPE: 'Seattle/NNP']
2.在我将输入更改为:
“盖茨于 1955 年 10 月 28 日出生在西雅图。”
test() 什么都不返回。
3. 我挖掘到nltk/sem/relextract.py发现这很奇怪
输出是由函数: semi_rel2reldict(pairs, window=5, trace=False)引起的,它只在len(pairs) > 2时返回结果,这就是为什么当一个句子少于三个NE时会返回None。
这是一个错误还是我以错误的方式使用了 NLTK?
api - 如何自动(以编程方式)训练知识库?
在微软 Cognitive Services提供的QnA Maker Service 中,我们可以通过手动插入 QnA 对来训练我们的 KB(知识库)。
有没有办法使这个过程自动化,以便我们始终保持我们的知识库是最新的?有一个 API 文档,但我找不到用于此目的的文档。
请指教。提前谢谢大家。
nlp - 远程监督中的“远程”是什么意思?
在 ACL 09、Mintz 等人中提到。
远程监督假设是,如果两个实体参与关系,则包含这两个实体的任何句子都可能表达该关系。
这很容易理解。但是,远程监督中的“远程”是什么意思?或者我们如何定义“遥远”?
例如,给定一个与引用的方法不同的每周监督训练集泛化方法。我们如何定义它是“远程监督”还是“非远程监督”?边界是什么?我最近对此感到困惑。
nlp - 将 NLP 转换为 CSP:故事一致性
背景:我想知道是否有人成功地将自然语言转换为代表约束满足问题的知识库。我希望对一个人的陈述进行约束满足,以便在对陈述进行解决证明时查看是否存在任何不一致之处。这可以在法庭或选举辩论中使用。
因此,布置我的理想主义故事一致性算法:
如何将语句转换为可用子句?
例如:
prolog - Prolog 知识库中的未知数
我正在尝试学习Prolog,看来知识的完整性很重要,因为显然如果知识库没有事实,或者事实不正确,都会影响查询结果。我想知道如何最好地处理一个事实的未知细节。例如,
我添加到知识库中的一些人仍然活着,因此他们的死亡年份是未知的。在统治者的例子中,第一位统治者没有前任,当前统治者没有继任者。如果有这些未知数,我应该输入某种未知的标志值还是可以省略细节。就统治者而言,不知道前任的事实会是这样吗?
clojure-core.logic - “事实数据库”不是迷你看人的核心功能吗?
我一直在玩 miniKanren,试图通过将非常基本的 Prolog 教程转换为它来理解它。
我习惯使用 Python,所以我从 LogPy 库开始,该库后来被分叉并改进为实际上称为miniKanren的库
从 lib 的 README 中给出的示例中,我们可以看到:
这与您在 Prolog 教程开始时可能会看到的内容相对应,例如:
我对此很满意。后来我发现自己阅读了越来越多的 MiniKanren 文献(一般意义上,不是 Python 库),我意识到我没有看到任何以这种方式使用事实数据库的示例,或者提到一个。
我错过了吗?或者这实际上不是 MiniKanren 的“A Reasoned Schemer”的一个特点?
我确实在 Clojurecore.logic
实现中找到了这样的东西,其中有:
https ://github.com/clojure/core.logic/wiki/Features#simple-in-memory-database
它以非常相似的方式工作,尽管比 python 更好,因为 db 是一个独特的实体,而不是 lib 中的全局变量。
python lib是否只是借用了一个非kanren的想法core.logic
?还有其他类似的 MiniKanren 实现吗?还是完全不同的方法?
sharepoint - 在 QnA Maker 知识库中导入 Sharepoint 页面不起作用
我正在尝试将 QnA Maker 知识库中的 Sharepoint 页面作为 URL 导入,但没有成功。每次获得一个:
我已阅读此处的文档,但没有帮助。
- Sharepoint 不公开
- 添加 URL 时我使用的帐户已启用访问共享点
- 单击“保存并训练”时,会出现身份验证弹出窗口(确实很快,我看不到里面的内容,但我认为这是成功执行的令牌请求。所以我认为这不应该是相同的情况)
- 如果我将页面保存为 PDF 并将其作为文件导入,它可以工作。
- 我要导入的不是 SharePoint 上的某个文件,我需要导入页面本身。
关于如何理解问题的任何想法?
页面格式?不应该,由于 4)
许可?不应该,因为 3)
还有什么?
rest - Salesforce 知识库 URL 可见性(需要公开和登录/0
我们正在使用 SF API/services/data/v52.0/parameterizedSearch/?q=${searchQuery}&sobject=Knowledgearticleversion&KnowledgeArticleVersion.where=publishStatus='online'&KnowledgeArticleVersion.fields=KnowledgeArticleId,title,urlName&defaultLimit=10
搜索 KnowledgeArticleId 并进一步使用该 KnowledgeArticleId 使用 API 获取文章的 url:/services/data/v52.0/knowledgeManagement/articles/siteListForOnlineArticle?ArticleId="+res.data.searchRecords[i].KnowledgeArticleId+"&Language=en_US
- 当我们检查
Visible To Partner
,Visible To Customer
, 时Visible To Public Knowledge Base
,我们无需登录即可打开 url。 - 当我们只检查
Visible to Partner
, Visible To Customerand
Visible To Public Knowledge Base 时,我们被要求登录。 - 当我们重复过程 1. 我们被要求再次登录。(我们不应该被问到)
谁能解释一下这里发生了什么?我是否遗漏了任何公众知名度。