ibm-cloud - 没有在炼金术 api 演示中选择正确的作者字段

Question

我正在尝试在线演示：http ://www.alchemyapi.com/products/demo/alchemylanguage

我粘贴在您的一篇博客文章中：http: //www.programmableweb.com/news/alchemyapi-updates-api-brings-deep-learning-to-masses/2013/07/25

对于 Alchemyapi 返回的 Author 字段，我得到“Google+”，而在博客文章中它说作者是“Amy Castor”

为什么会发生这种情况？

顺便提一句。我最近发布到 ibm dwanswers 但发现他们正在转移到 stackoverflow，因此交叉发布

score 1 · Accepted Answer

作者信息可以通过多种不同方式嵌入到新闻文章或博客文章中，包括在页面元数据中、使用 REL 链接、纯文本等。由于没有标准的方式通过 HTML 标签（即标签）来表达作者，因此可靠地提取作者是一项复杂的任务。AlchemyAPI 并行使用十几种技术来尝试找到作者，然后交叉引用结果以确定最有可能成为作者的候选人。AlchemyAPI 使作者提取的艰巨任务易于集成到您的应用程序中。

它认为该特定文章的作者是 Google+ 的原因是因为它出现在 REL 链接中。

在文章的底部，它说：

关于作者：Amy Castor 在 Google+ 上关注我

该 Google+ 字链接到https://plus.google.com/108856065353244179079?rel=author

算法正在接受这个 ?rel=author 论点，因此认为 Google+ 是作者。

在很多情况下这是正确的，但这是错误的情况之一——这就是认知计算的本质。

ibm-cloud - 没有在炼金术 api 演示中选择正确的作者字段

1 回答 1

Related

Reference