问题标签 [opencalais]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - OpenCalais 无法查看重要性值
我正在使用PHP-OpenCalais库从文本中提取数据。实体的 var_dump 给出如下内容:
但是,这丢失了很多信息,例如,socialTag 元素没有重要性值,它们应该具有重要性值,因为这是在 JSON 响应中返回的:
我认为我用来解析 JSON 响应的opencalais.php类的这些代码行中的问题(这些是第 71-76 行):
python - 使用偏移量和长度更改具有多个值的子字符串
我正在从 OpenCalais API 中提取数据,以下是详细信息:
输入:某个段落(一个字符串,例如“Barack Obama 是美国总统。”此外,返回的是一些具有偏移量和长度但不一定按出现顺序的实例变量。
输出(我想要):相同的字符串,但带有超链接的已识别实体实例(这也是一个字符串),即
但这确实是一个 Python 问题。
这就是我所拥有的
现在的问题是,如果您正确阅读代码,您会知道在第一次迭代之后,输出字符串会发生变化 - 因此对于后续迭代,偏移值不再以相同的方式应用。所以,我无法做出预期的改变。
基本上试图得到:
怎么可能,我想知道。尝试拼接 n 切片,但字符串会出现乱码。
python - 尝试迭代使用 OpenCalais 获得的 Python dict 时出现 KeyError
我正在尝试使用 OpenCalais 标记内容。以下是我正在使用与 API 通信的代码:
无论如何,这很好用,因为我能够获得以下输出(打印输出)。
我注意到的是键都是超链接。无论如何,我想从输出中打印所有的 socialTags。为此,我编写了以下代码:
但是,我收到此错误:
这是什么错误?或者更准确地说,获取 socialTags 的正确方法是什么?谢谢。
solr - 将 Solr 与 UIMA 集成时出现异常
我正在尝试将 UIMA 与 Solr 集成。我正在按照https://cwiki.apache.org/confluence/display/solr/UIMA+Integration中提到的步骤进行操作。但是当我尝试索引文档时,终端中会抛出异常,并且 solr 日志也会记录错误跟踪。我一直在尝试解决一段时间,但无法为该问题找到适当的解决方案。我已经包含了文档中提到的所有罐子。我已经为 API 生成了有效的密钥。
分析领域:
内容字段是字段类型 text_general。它不是复制字段。该字段包含相应的文档内容。
solrconfig.xml:
终端错误跟踪:
solr.log:
我一直在为这个问题苦苦挣扎一段时间。
谢谢并恭祝安康。
java - 使用 Open Calais 的法语文档中的字符集编码错误
我正在尝试对 OpenCalais API 进行简单调用,以在用法语编写的原始文档中进行实体标记(因此有很多重音字符)。在返回的响应中,所有重音字符都转换为奇怪的符号。
我已经阅读了 API 文档,我将标题“Content-Type”设置为“text/raw; charset=utf-8”,我检查了文本肯定是用 UTF-8 编码的。
这是我用来从文件中读取内容的代码:
在发送请求之前,我已经打印出了从文件中读取的字符串。它显示了没有编码错误的原始文本。
这是我用来发出请求并从 OpenCalais API 获取响应的代码:
以下是我尝试过的几件事(但失败了):
- 重写整个文本(不复制粘贴),
- 复制 Sublime Text 中的文本,更正所有可能的重音符号(我删除重音符号并再次重写它们以确保没有来自复制粘贴的意外编码冲突),使用编码 UTF-8 保存。
你能告诉我如何解决吗?谢谢!
PS:我在他们网站上的 OpenCalais 论坛上发布了我的问题,但尚未收到解决方案。
semantics - 使用 Google NL API 和 Open Calais API 提取命名实体
我试图从文本中识别命名实体并将它们分类为人物、地点和组织。我正在使用 Google 的 Cloud Natural Language API 和 Open Calais API 来识别命名实体。
当我输入包含“中国”一词的文本时,Google NL API 将其识别为“人”类型。然而,它在文件中的上下文含义将其作为一个国家来处理。Google NL API 是否能够根据文本上下文提供实体?如果是这样,请让我知道我错过了什么。
如果文本包含单词“obama”,则 google NL API 将“Obama”输出为 Person,而 Open Calais API 将“Barak Obama”标识为 Person。为什么会这样?还有什么其他方法可以从文本中的术语中获取确切的命名实体,比如 Open Calais 返回的那个?