问题标签 [oai]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
355 浏览

xml - BASE OAI-PMH 验证器中的错误“QName 值 X 在范围内没有相应的命名空间声明”

我想使用以下网站验证 OAI:http: //oval.base-search.net/

但它给了我这个错误:

错误:ListRecords 响应格式正确但无效:元素'{ http://purl.org/dc/elements/1.1/ }标识符',属性'{ http://www.w3.org/2001/XMLSchema-instance } type':QName 值 'dcterms:DOI' 在范围内没有对应的命名空间声明。第 38 行

我不知道它的意义。

0 投票
1 回答
431 浏览

dspace - OAI-PHM。不更新记录

我的 DSPACE 和 OAI-PHM 有问题,无法更新 OAI 中的记录../oai/request?verb=ListSets,它显示了旧配置和旧记录 (33) 现在它们是 97。我向您展示了命令:

返回
numFound="97"

因为客户端的OAI-PMH没有更新97条记录。

请帮忙,
谢谢

0 投票
1 回答
102 浏览

php - OAI 验证错误

我在 openarchives 中验证了我的 oai 代码。很多错误。大部分已清除。但仍然有 2 个错误。它显示错误,例如“用于识别的 FAIL POST 测试 1 不成功,收到了 OAI 错误响应”。任何人都知道是什么类型的错误this.附加错误图片 谢谢

0 投票
1 回答
237 浏览

dspace - 如何在 DSpace 的集合中创建虚拟集?

我在服务器 A 中有一个集合,它混合了不同的项目类型。现在,我想在为每种可用项目类型设置的不同集合中从服务器 B 收集这个集合。

场景将是这样的:

所以在上面的场景中,集合 B1、B2 和 B3 都将具有相同的 OAI 提供程序,其记录来自服务器 A 中相同集合的记录,即 CollectionA,除了 CollectionB1 将只收集项目类型为 Article、CollectionB2 的项目类型为 Book chapter 和CollectionB3 与项目类型会议论文。

我在一些示例中看到了如何基于元数据或项目类型创建虚拟集,但据我所知,这些虚拟集应用于存储库中的所有内容。

我的问题是如何仅通过集合 A 中的项目类型在服务器 A 中创建虚拟集?

0 投票
0 回答
83 浏览

python - 解析 OAI2/XML 格式

我有这种格式来解析: http ://export.arxiv.org/oai2?verb=GetRecord&identifier=oai:arXiv.org:0804.2273&metadataPrefix=arXiv

所以我想得到作者的名字:

但我得到这个错误:

问题是名字,如果我删除它一切正常。我该如何解决?

0 投票
1 回答
47 浏览

python - 尝试使用 pyoai 连接到 OAI 提供程序时如何修复 python 中的 HTTP 错误 404

我正在尝试使用 pyoai 将我与 OAI 提供商联系,但我收到此错误

我在 Windows 10 上使用 python3.7

这是我的代码,很简单,遵循官方 pyoai 文档 https://pypi.org/project/pyoai/

我收到 HTTPError

我以为问题出在使用 python3.7 但我已经更改为 3.6 并且我遇到了同样的问题

0 投票
1 回答
180 浏览

python - 从 pyoai 读取元数据结果

我正在使用 python3.7 上的 pyoai 库使用 oai-pmh 协议收集元数据,但在读取记录列表时遇到了麻烦

我正在检查元组上的一种 xml 文件,但结果是这样的:

如果我忘记了什么,你能告诉我吗

0 投票
0 回答
48 浏览

python - 如何并行化 Sickle 的 OAIIterator(或类似方法)?

我目前正在使用 Python 的 Sickle 模块来遍历约 4 百万条记录的 OAI 存储库。我一直在查看 Sickle 文档,看看是否有一种明显的方法来分离记录,一旦由镰刀.ListRecords 返回,以一种对执行数据并行任务有意义的方式。更清楚地说,这就是我想做的事情:

我怀疑 Sickle 本身没有办法在本地执行此操作,但如果我可以将镰刀.ListRecords 的返回分成不同的部分,那将非常有帮助。如果没有,如果有人可以在 python 中推荐一种允许并行性的类似方法,我将不胜感激。

0 投票
1 回答
91 浏览

python - Sickle 是否以随机顺序访问 OAI 记录?

我一直在使用 Python 中的 Sickle 库,以便从开放存取期刊目录中访问 OAI-PMH 记录。我注意到,以下代码会在每次运行前 4000 篇文章中产生相似但略有不同的英文文章结果(尽管每次运行时,它会产生大约 2500-2600 篇)。在我之前为检索和下载全文文本而运行的另一段代码中,我注意到文章每次都在更改。这似乎 Sickle 不是每次都以相同的顺序抓取 OAI 记录,这让我想知道它们是否是按随机(ish)顺序抓取的?我是 OAI 格式的新手,所以我不确定这种(看似)随机排序是否是 OAI 记录通常如何存储的属性,

0 投票
1 回答
53 浏览

php - 一个 POST 请求的 OAI-PMH 数据提供者验证失败,尽管它正在使用 curl

我在 PHP 中实现了一个符合 OAI-PMH2 的数据提供程序(它从 MySQL 数据库中检索数据),并且我正在尝试对其进行验证,但我遇到了一个阻止成功验证的错误。

该错误与此问题中描述的内容有些相关,但是在我的情况下,POST 请求verb=Identify成功通过,而第二个请求失败。

更烦人的是,当我使用 发送相同的请求时,它会成功处理curl,即它输出格式正确的 XML。

更具体地说,我得到的错误如下:

(当然,www.mydataprovider/my_oaipmh2.php 代表实际 URL。)

因此,我尝试通过 执行(多次)相同的 POST 请求curl,如下所示:

它总是成功地返回带有第一条记录的正确 XML 响应。

我错过了什么?这可能是由于某些服务器端设置造成的吗?
(我自己无权访问服务器管理,但我当然可以询问托管服务提供商。)