问题标签 [spotlight-dbpedia]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
dbpedia - 如何通过 DBPedia Spotlight 提取 DBPedia 类别?
我正在尝试从通过 DBPediaSpotlight 命名的实体中提取类型及其各自的级别。我已经查看了论坛,git hub 的文档,但一无所获。我想知道进行这种提取的一种方法。谢谢!
java - DBPedia 聚焦较小的文本(单词)而不是段落
我认为这个问题之前被问过,但由于未知原因被删除。我对 DBPedia 很陌生,对编写查询知之甚少。我要解决的问题是自然语言问题。我能够从给定的句子中提取实体。我能够将其中一些分类为姓名、组织和人员,但无法正确分类其余部分。所以我想添加一个查找选项,我在 DPpedia 之类的数据库中查找它们以进行分类。就在昨天,一位好心人建议我看看 DBPedia Spotlight。我浏览了他们的文件。将它集成到我的 java 代码中的最佳方法是:
但是,我不想注释段落。只需对我从可能是可能实体的句子中提取的单词运行注释,例如在句子“雅虎首席执行官玛丽莎梅耶斯昨天在新闻发布会上说......”我能够提取雅虎和玛丽莎梅耶斯。现在我想使用 DBPedia 为它们分配一个分类。
任何帮助将不胜感激。
spotlight-dbpedia - 使用 pyspotlight 工具从文本中获取资源名称
我正在尝试使用 pyspotlight 从文本中查找资源名称。假设文本为“Barack Obama is tall”,则程序应将 Barack Obama 作为 dbpedia 资源返回。但程序显示“equests.exceptions.HTTPError: 404 Client Error:找不到网址:https ://github.com/dbpedia-spotlight/dbpedia-spotlightrest/ “错误。如何解决。
进口聚光灯
annotations = Spotlight.annotate(' http://spotlight.dbpedia.org/rest/','Barack Obama 很高',confidence=0.4, support=20)
打印(注释)
文件“word.py”,第 2 行,在 annotations =spotlight.annotate(' http://spotlight.dbpedia.org/rest/ ','Barack Obama is high',confidence=0.4, support=20)
文件“/home/junlplab/.local/lib/python2.7/site-packages/spotlight/init .py ”,第 189 行,在注释中
_post_request中的文件“/home/junlplab/.local/lib/python2.7/site-packages/spotlight/init .py”,第 51 行
文件“/home/junlplab/.local/lib/python2.7/site-packages/requests/models.py”,第 937 行,在 raise_for_status 中引发 HTTPError(http_error_msg, response=self)
requests.exceptions.HTTPError:404 客户端错误:找不到 url:https ://github.com/dbpedia-spotlight/dbpedia-spotlightrest/
javascript - 如何将我的 curl 方法转换为在我的 javascript 脚本中工作?
javascript 初学者,我正在寻找将 curl 方法转换为在我的 javascript 脚本中工作的方法。
这是我的卷曲方法:
我的 ajax 测试(不起作用):
ontology - DBpedia Spotlight 的参数是什么意思?
我对使用 DBpedia Spotlight 很感兴趣。但是,我们需要为两个参数confidence和support插入一个值。这两个参数的真正含义是什么?
我想识别文本中重要的、突出的 n-gram。在这种情况下,置信度和支持参数的通常建议是什么(经验法则)?
nlp - 如何使用 DBpedia 属性来构建主题层次结构?
我正在尝试按照下面提到的两个 DBpedia 属性来构建主题层次结构。
- skos:更广泛的财产
- dcterms:主题属性
我的意图是给这个词确定它的主题。例如,给定单词;'支持向量机',我想从中识别主题,例如分类算法、机器学习等。
但是,有时我对如何构建主题层次结构感到有些困惑,因为我获得了超过 5 个主题 URI 和许多更广泛属性的 URI。有没有办法测量强度或其他东西并减少我从 DBpedia 获得的额外 URI 并仅分配最高可能的 URI?
那里似乎有两个问题。
- 如何限制 DBpedia Spotlight 结果的数量。
- 如何限制特定结果的主题和类别数量。
我当前的代码如下。
如果需要,我很乐意提供更多示例。
spotlight-dbpedia - Dbpedia spotlight API limits
Are there any limits using the dbpedia-spotlight APIs ?
I found the endpoint documented here https://www.dbpedia-spotlight.org/api but the page does not speak about any limits such as rete-limits and about the endpoint availability.
docker - 如何使用 dbpedia 聚光灯 docker 镜像?
我正面临 dbpedia 聚光灯的问题。我似乎无法连接到此处找到的本地 docker 映像。
我使用了命令docker pull dbpedia/spotlight-english
,docker run -i -p 2222:80 dbpedia/spotlight-english
然后检查了容器是否正在运行docker ps
。一切正常。
之后,我尝试通过运行 Spotlight文档中给出的 curl 来查询服务器:
与以下 URL 相同:
- http://127.0.0.1:2222/en/annotate/
- http://127.0.0.1:2222/en/
- http://127.0.0.1:2222/
- http://0.0.0.0:2222/en/
- http://0.0.0.0:2222/
我得到的只是curl: (52) Empty reply from server
。
我没有得到什么?所有帮助表示赞赏。
nlp - 将 UIMA RUTA 与现有标记器一起使用
我最近开始使用 UIMA RUTA。我有几个问题。1:我们如何在RUTA中使用现有的标注器(DBpedia标注器,MunPx标注器)?2:我们如何使用 Annotation Writer 格式化输出?3: RUTA 是否将 .txt 之外的其他文件格式作为输入?
sparql - 如何改善 DBpedia Spotlight 的结果?
我正在使用 DBpedia Spotlight 来提取 DBpedia 资源,如下所示。
我的文字如下所示:
常春藤提取物在临床实践条件下对炎症性支气管疾病的耐受性、安全性和有效性:一项针对 9657 名患者的前瞻性、开放、多中心上市后研究。在这项上市后研究中,9657 名患有支气管炎(急性或慢性支气管炎性疾病)的患者(5181 名儿童)接受了含有干常春藤叶提取物的糖浆治疗。治疗 7 天后,95% 的患者症状改善或痊愈。治疗的安全性非常好,不良事件的总发生率为 2.1%(主要是胃肠道疾病,发生率为 1.5%)。在那些同时服用药物的患者中,可以证明额外使用抗生素对疗效没有好处,但确实将发生副作用的相对风险增加了 26%。总之,就是说干常春藤叶提取物对支气管炎患者有效且耐受性良好。鉴于所考虑的人口众多,未来的分析应处理有关按年龄组、伴随治疗和基线条件的治疗的具体问题。
我得到的结果如下。
如您所见,结果不是很好。
例如,考虑Hedera helix extract
上面提到的文本。即使 DBpedia 有Hedera helix
( http://dbpedia.org/resource/Hedera_helix
) 的资源,Spotlight 仍将其作为两个 URI 输出为http://dbpedia.org/resource/Hedera
和http://dbpedia.org/resource/Helix
。
根据我的数据集,我想得到 DBpedia 中最长的词作为结果。在这种情况下,我可以做哪些改进来获得我想要的输出?
如果需要,我很乐意提供更多详细信息。