1

我正在尝试在线演示:http ://www.alchemyapi.com/products/demo/alchemylanguage

我粘贴在您的一篇博客文章中:http: //www.programmableweb.com/news/alchemyapi-updates-api-brings-deep-learning-to-masses/2013/07/25

对于 Alchemyapi 返回的 Author 字段,我得到“Google+”,而在博客文章中它说作者是“Amy Castor”

为什么会发生这种情况?

顺便提一句。我最近发布到 ibm dwanswers 但发现他们正在转移到 stackoverflow,因此交叉发布

4

1 回答 1

1

作者提取文档中:

作者信息可以通过多种不同方式嵌入到新闻文章或博客文章中,包括在页面元数据中、使用 REL 链接、纯文本等。由于没有标准的方式通过 HTML 标签(即标签)来表达作者,因此可靠地提取作者是一项复杂的任务。AlchemyAPI 并行使用十几种技术来尝试找到作者,然后交叉引用结果以确定最有可能成为作者的候选人。AlchemyAPI 使作者提取的艰巨任务易于集成到您的应用程序中。

它认为该特定文章的作者是 Google+ 的原因是因为它出现在 REL 链接中。

在文章的底部,它说:

关于作者:Amy Castor 在 Google+ 上关注我

该 Google+ 字链接到https://plus.google.com/108856065353244179079?rel=author

算法正在接受这个 ?rel=author 论点,因此认为 Google+ 是作者。

在很多情况下这是正确的,但这是错误的情况之一——这就是认知计算的本质。

于 2015-10-16T10:23:03.213 回答