问题标签 [marc]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1321 浏览

perl - 如何使用 Perl 将 ISBN 替换为 MARC 文件中的 Google 图书 ID?

我有一个文件,其中包含一些MARC格式的图书数据,其中一些行是 ISBN。如果存在,我想用该 ISBN 的 Google 图书 ID 替换这些行。这是到目前为止的代码,最后只是删除了这些行:

perl -pe "s#ISBN(.*)#$(wget --output-document=- --quiet --user-agent=Mozilla/5.0 \"http://books.google.com/books?jscmd=viewapi&bibkeys=\1\")#mg" < 5-${file} > 6-${file}

PS:Google 对自动化工具的使用有点模糊:Books Data API推荐使用 curl / wget 之类的工具,但没有说明如何避免在使用此类工具时被屏蔽。我也很确定我在 ToS 中看到一个子句说用户不能发送自动查询,但我再也找不到它了。这是在他们的论坛中讨论的。

0 投票
2 回答
545 浏览

xml - 将相似的 XML 文件与 XSL 合并时出现问题

我有两个需要合并的文档,它们的发生方式似乎无法在其他示例中找到。即,它不仅需要匹配上一级节点的属性,还需要匹配低于该节点级别的属性值,以获得该节点的值。

我正在尝试获取此样本:

当“datafield” '035'、“subfield” 'a' 的值匹配时,例如“12345”

结果应该是:

我尝试使用我发现的进行查找的示例,但它们似乎都不起作用。我没有包含任何 XSL,因为我的所有结果都是灾难性的。我一直在看它,好像它一定很简单,但我只是没有得到任何体面的结果。任何帮助或指示将不胜感激。

谢谢!

0 投票
3 回答
1336 浏览

c# - 从访问到 MARC 并返回

我有一个包含有关书籍详细信息的访问文件,我需要获取详细信息并将它们转换为 marc 记录,反之亦然。最好的方法是什么?

0 投票
2 回答
2026 浏览

python - Python编码转换

我编写了一个 Python 脚本,用于处理以 UTF-8 编码的非 ascii 字符的 CSV 文件。但是输出的编码被破坏了。因此,从输入中:

我在输出中得到这个:

你能建议编码错误可能来自哪里吗?你以前见过类似的行为吗?

编辑:我正在使用带有文档中特色类的csv标准库。我使用 Python 2.6.6 版。UnicodeWriter

编辑2:重现行为的代码:

输入数据可在此处获得(大文件)。

0 投票
1 回答
531 浏览

marc - KORMARC 到 MARC21 转换器

有谁知道是否有免费的开源解决方案可以将 KORMARC(韩国 MARC)转换为 MARC21(又名 USMARC)?

0 投票
2 回答
1388 浏览

c# - 使用 MARC 文件

我有一个图书馆的数据库项目。图书馆中几乎所有的图书信息都可以在国会图书馆获得,该图书馆提供可免费下载的图书记录,这些记录存储在 *.mrc 文件 (MARC) 中。我需要从 MARC 文件中检索这些记录并导入我的数据库。任何人都可以为我提供一个可以实现以 MARC 格式读取、操作、输出和转换书目记录的框架吗?或者我可以至少将 MARC 格式转换为 XML 格式?请注意,我使用 .net 板形式来开发我的应用程序,即 c# 和 sql server。

先谢谢了!

0 投票
3 回答
3673 浏览

python - 如何使用 Python 解析以 MARC21 格式存储的文档

昨天,哈佛发布了对其所有图书馆元数据(约 1200 万条记录)的开放访问

我正在寻找解析数据并使用它,因为发布的目标是“支持创新”

下载 12GB 压缩包,解压后找到 13 个 .mrc 文件,每个文件大约 800MB

MARC21 格式

当我查看前几个文件的头部和尾部时,即使阅读了一些关于 MARC21 的内容,它看起来也非常非结构化。

这是第一个文件的前 4k 的样子:

$ head -c 4000 ab.bib.00.20120331.full.mrc

以前有人用过 MARC21 吗?它通常看起来像这样还是我需要以不同的方式解析它。

0 投票
3 回答
8660 浏览

mysql - MySQL 更新 XML 属性

在数据加载中,似乎一些 XML 属性映射不正确,我现在正在尝试纠正这个问题,但我正在努力解决 MySQL 对此 XML 列的处理。

我想更正所有出现的带有子字段(带有属性'code="3"')的字段(带有属性'tag="520"')的XML属性(非值)。下面的查询返回 0 行受影响,1 行找到。关于如何实现这一目标的任何线索。

为了清楚起见,包括 XML 片段:

原始片段

我想要的结果是:

无法弄清楚如何突出显示代码块中的更改(它是 tag="520" 数据字段中的 ind1 属性,它是关联的子字段属性)

0 投票
2 回答
74 浏览

c# - 在 C# 中处理字符串需要一些帮助吗?

我有一个非常大的字符串,我正在尝试将其从旧标准转换为 marc21 xml 标准。

以下代码行:

产生以下内容:

问题非常明显。

我对特定术语执行一揽子转换,并将其替换为“marc:controlfield”。在我的转换过程即将结束时,我开始处理领导者元素。这就是我现在的位置。精通xml的人知道:

需要是:

完成此操作后,可以测试我的字符串的格式和有效性等。我正在努力研究如何抓住前导元素的右括号并将其替换为 xml,如上所示。

最初的 Leader 元素如下所示:

任何帮助是极大的赞赏。

0 投票
1 回答
263 浏览

solr - MARC21 - 书目记录文件:创建新字段并将修改后的值放在那里的脚本

我有一个包含书目记录的 MARC 文件,其中包含具有值的不同字段。例如作者、标题、出版年份等。数据结构如下所示:

为了实现某个功能,我需要将字段 852|3 的值复制、修改并写入记录文件,如下所示:

由于我是新手,我想知道是否有人知道这样做的最佳方法是什么?

ps: MARC 文件将被索引到 SolR 索引中。是否有可能在索引期间进行更改?