问题标签 [opencalais]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
rdf - 多语言 OpenCalais 之类的系统?
OpenCalais 系统给我留下了深刻的印象。它是(是/拥有)一个网络服务,您可以在其中发送文本,他们对其进行分析,然后为您提供文档所属的一系列分类(启用 RDF)标签。
但是 - 目前 - 英语是唯一支持的语言。
您知道处理多语言文档的类似系统吗?(我对意大利语很感兴趣,但多语言当然是加分项)
ontology - Rowlex 中的本体
我正在尝试将 Rowlex 用于此处找到的 opencalais 本体http://www.opencalais.com/files/owl.opencalais-4.3a.xml
我已经尝试过动物园样本本体,我想知道如何调用 opencalais 本体字段。
非常非常感谢你
c# - OpenCalais 在 .NET 中解析 RDF
有没有办法在 .NET 中解析 OpenCalais RDF,因为我正在使用 dotnetRDF,它一直给我错误。生成的 Rdf 样本可以在http://viewer.opencalais.com/中找到,我真的很迷茫,非常感谢任何帮助!如果您使用任何其他 api 或知道如何使其与 dotnetRDF 一起使用,请提供帮助,因为我真的真的迷路了
埃里卡
我还有以下内容(文件包含上述文本):
我得到以下异常 RDFParseException
StringParser 未能正确解析 RDF 字符串,StringParser 自动检测猜测为“NTriples”,但无法解析。RDF 字符串可能格式错误或 StringParser 可能猜错了
我真的迷路了,请帮助
parsing - 智能地从博客和其他网页中提取标签
我不是在谈论 HTML 标签,而是用于描述博客文章、youtube 视频或此站点上的问题的标签。
如果我只抓取一个网站,我只需使用 xpath 来提取标签,如果简单的话,甚至可以使用正则表达式。但我希望能够在我的 extract_tags() 函数中抛出任何网页并列出标签。
我可以想象使用一些简单的启发式方法,例如查找所有具有 id 或“标签”类的 HTML 元素等。但是,这非常脆弱,并且对于大量网页来说可能会失败。你们推荐什么方法来解决这个问题?
另外,我知道 Zemanta 和 Open Calais,它们都有办法猜测一段文本的标签,但这与提取真实人类已经选择的标签并不完全相同。但我仍然很想听听任何其他服务/API 来猜测文档中的标签。
编辑:为了清楚起见,一个已经适用的解决方案会很棒。但我猜没有开源软件已经做到了这一点,所以我真的只是想听听人们关于可能适用于大多数情况的方法。它不需要是完美的。
EDIT2:对于建议通常可行的通用解决方案的人是不可能的,并且我必须为每个网站/引擎编写自定义刮板,请考虑arc90 可读性工具。这个工具能够以惊人的准确性提取网络上任何给定文章的文章文本,使用我相信的某种启发式算法。我还没有深入研究他们的方法,但它适合一个书签,而且似乎并没有太多的参与。我知道提取一篇文章可能比提取标签更简单,但它应该作为一个例子来说明什么是可能的。
gwt - GWT 客户端“抛出异常”导致编译问题
我尝试使用从名为 j-calais 的 api 获取结果,然后将结果输出到网页上,我在客户端中编写了所有代码,但它无法正确编译,不知道为什么?请帮忙。源代码如下:
没有出现明显的错误,但无法编译成功.....非常感谢:
public void onModuleLoad() { // 为股票数据创建表。stockFlexTable.setText(0, 0, "类型"); stockFlexTable.setText(0, 1, "名称");
// 监听 Add 按钮上的鼠标事件。addStockButton.addClickHandler(new ClickHandler() { public void onClick(ClickEvent event) {
}
}
}
entity - 有哪些类似于 OpenCalais 或 AlchemyAPI 的商用平台可用于中文和日文的实体提取?
特别是,我希望能够提取人物、地点、电影、音乐等实体,并在广泛使用的链接数据 ID(如 DBpedia、Freebase 或 OpenCyc)中提供这些实体。
nlp - 了解 OpenCalais 的相关性分数
我试图了解 opencalais 返回的与每个实体相关联的相关性分数是多少?它意味着什么以及如何解释它?我将感谢您对此的见解。
jquery - 数据类型的 Jquery Ajax 调用问题
我正在使用 Jquery 尝试从Open Calais api 中获取一些数据,但如果我无法获得有效响应。如果我使用数据类型“脚本”,我会收到“缺少 ; before statement”的错误。如果我使用数据类型“xml”或其他任何内容,我会从 Open Calais 服务器收到 403 错误。
我决定根据这个加莱论坛帖子的最后一个条目尝试“脚本”数据类型
请不要保留对我的代码的批评和评论。我边走边靠。
我的代码:
}
python - 根据商品描述自动生成电子商务标签
我们正在开发一个电子商务门户,使用户能够在网站上列出他们的项目(名称、描述、标签)。但是,我们意识到用户对物品标签的理解不是很好,他们中的一些人写了任意词,有些人把它留空,所以我们决定处理它,我考虑使用实体提取器来生成标签,首先,我尝试将此列表传递给加来:
我是一名菲律宾男性,正在寻找办公室助理工作,具有 MS Word、Excel、Power Point 和 Internet 浏览方面的知识,我是一个快速学习者,具有清晰和礼貌的沟通技巧,在工作分配和工作时间方面具有极大的灵活性,并以全心全意、正直和诚实履行我的职责。
我得到了这些标签:Religion Belief
, Positive psychology
, Integrity
, Evaluation
, Behavior
, Psychology
, Skill
.
然后我尝试了斯坦福 NER并得到:Excel
, Power
, Point
, &
, Internet
,Browsing
在那之后,我停止尝试这些解决方案,因为我认为它们不适合,并开始考虑拥有一个可能包含产品/品牌名称和贸易相关术语的电子商务相关词库,以便我可以使用它来过滤用户生成的帖子并找到合适的标签,但我找不到。
所以第一个问题:我错过了什么吗?
第二个问题:是否有更好的方案(即生成标签)?