问题标签 [file-format]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
117 浏览

testing - 输出文件的功能测试,当输出是不确定的(或低控制)

很久以前,我不得不测试一个生成 postscript 文件图像的程序。确定程序是否产生正确的预期输出的一种快速方法是对结果进行 md5 以与我事先检查的“已知良好”输出的 md5 进行比较。

不幸的是,Postscript 包含文件中的当前时间。当然,这个时间会根据测试运行的时间而有所不同,因此即使获得了预期的输出,也会改变结果的 md5。作为修复,我只是用 sed 去掉了日期。

这是一个美好而简单的场景。我们并不总是那么幸运。例如,现在我正在编写一个编写器程序,它创建一个包含一堆匿名节点和 uuid 的大型 RDF 文件。用一个简单的 md5 基本上不可能检查整个程序的功能,唯一的办法就是用阅读器读取文件,然后通过这个阅读器验证输出。正如您可能意识到的那样,这打开了一个新的蠕虫罐:首先,您必须编写一个阅读器(这可能很耗时),其次,您假设阅读器在功能上是正确的,同时与编写器同步。如果读取器和写入器同步,但假设不正确,读取器会说“没问题”,但文件格式实际上是错误的。

当您必须对文件格式执行功能测试时,这是一个普遍问题,并且文件格式不能通过您提供的输入完全重现。你如何处理这个案子?

0 投票
3 回答
8928 浏览

c# - 如何阅读 Lotus Notes 邮件存档 (*.nsf)

有谁知道如何在不使用互操作或 COM 交互的情况下读取这些文件?只是直接的方式。有没有这种格式的规范或逆向工程的东西可以帮助解决这个问题?谢谢。

0 投票
0 回答
1942 浏览

mysql - MySQL如何在磁盘上存储行?

我正在寻找有关 MySQL 如何在磁盘上存储数据的文档,特别是 InnoDB 和 MyISAM。

我在大学上过一门数据库课程(并写了一个原始数据库),所以我有了一个大致的想法。

我可以在这里问一堆问题,关于如何将各种类型存储在行中,以及如何将行存储在磁盘上,或者全力以赴,只用令人难以忍受的细节描述我的整个系统并询问如何构建它,但我认为简单地学习它如何存储记录就可以让我自己用更少的带宽来解决它。

这是否记录在任何地方(源代码之外)?

谢谢!

0 投票
8 回答
138479 浏览

csv - CSV 文件可以有评论吗?

是否有任何官方方法允许 CSV 格式的文件允许评论,无论是在自己的行上还是在行尾?

我尝试检查wikipediaRFC 4180,但两者都没有提到任何让我相信它不是文件格式的一部分的东西,所以这对我来说很糟糕,然后我应该使用单独的 ReadMe.txt 文件来解释文件。

最后,我知道添加自己的评论对我来说很容易,但我希望 Excel 之类的东西可以直接导入它,而无需消费者自定义导入过程。

那么,想法?

0 投票
3 回答
611 浏览

data-structures - 音乐的语义(或符号)表示

我正在寻找一个小应用程序,允许用户视觉和控制(主要是)古典音乐,以便更好地识别诸如佳能之类的结构。存储音乐的合适数据和文件结构是什么?

我对音乐知之甚少,所以这对我来说将是两个层面的学习经历。我想从基本的可视化开始,例如在音乐以受控速度播放时突出显示乐谱中的音符。我想用 C# 在 WPF 中执行此操作,从结构化文件中读取音乐。

0 投票
1 回答
697 浏览

macos - 解析 RealLegal 的 .PTX 文件格式

有人有解析 RealLegal PTX 文件格式的经验吗?我有兴趣为这种专有格式创建一个 Mac 阅读器客户端。

PTX 文件格式广泛用于存储法庭和证词记录。

0 投票
7 回答
8344 浏览

python - 关于如何解析自定义文件格式的提示

抱歉标题模糊,但我真的不知道如何简洁地描述这个问题。

我创建了一种(或多或少)简单的特定于域的语言,我将使用它来指定适用于不同实体(通常是从网页提交的表单)的验证规则。我在这篇文章的底部包含了一个示例,说明该语言的外观。

我的问题是我不知道如何开始将这种语言解析为我可以使用的形式(我将使用 Python 进行解析)。我的目标是最终得到一个规则/过滤器列表(作为字符串,包括参数,例如'cocoa(99)'),应该(按顺序)应用于每个对象/实体(也是一个字符串,例如'chocolate','chocolate.lindt'等)。

我不确定从什么技术开始,甚至不知道有什么技术可以解决这样的问题。你认为最好的方法是什么?我不是在寻找一个完整的解决方案,只是在正确的方向上进行一般性的推动。

谢谢。

语言示例文件:

0 投票
3 回答
2791 浏览

sql-server - sqflt8、sqlmoney等原生SQL数据类型的二进制存储格式有哪些?

根据文档,可以使用原生 SQL Server 数据格式的 bcp 导入或导出原生(二进制)数据。这些示例包括 SQLFLT8、SQLFLT4、SQLMONEY 或 SQLNUMERIC。

有谁知道各种类型的数据格式是什么,或者在哪里可以找到指定这些格式的文档。例如,SQLFLT8 是存储为 IEEE 双精度数还是其他格式?

编辑:kevchaddersAndrew的回答中,我有一点顿悟,对 #define 和 typedef 进行了一些谷歌搜索,看看是否可以找到带有定义的 C 头文件。这想出了一个文件odbcdss.h;我在下面发布的答案从文件中提取了一些内容,看起来很有希望。

0 投票
4 回答
1329 浏览

serialization - 二进制文件和保存的游戏格式

我正在开发一款小型 roguelike 游戏,在创建存档游戏方面需要一些帮助。我尝试了几种保存游戏的方法,但加载总是失败,因为我不确定什么是为玩家、实体和地图标记不同部分的开始的好方法。

什么是标记每个部分的开头的好方法,以便在不知道每个部分的长度的情况下可以可靠地读回数据?

编辑:语言是 C++。看起来可读的格式会更好。感谢所有快速回复。

0 投票
2 回答
125 浏览

xml - 我需要以文本格式与不同的程序交换数据你有什么建议?

我们的程序需要从/向不同程序导入/导出数据,每个程序都来自特定的独立属性。这些公司中的大多数会发送 2 个文本文件:第一个包含数据内容,第二个包含描述。假设这个例子:

内容文件:TheArtofDeceptionKevin11.53

为了解决这个问题,我为每个公司使用了一个基于 Jason 的配置文件,为了提取数据,我会解析 jason,提取偏移信息并导入......但最近我正在考虑为此使用数据库,假设将主键定义为 (company, docType, fieldname) 并将列定义为 (start, end)

你觉得最后的设计怎么样?我希望有人已经经历过这个并帮助我想出一个好的解决方案。

谢谢,

好吧,我实际上是指使用数据库,即为每个公司解析这些配置文件并将描述存储在数据库中。这样我认为,每次我想从特定的已知公司导入数据时,我都不需要解析配置文件。所以所有的交换文件只解析一次并存储到数据库中,每当我需要从新的内容文件中导入数据时,我只需查询数据库并提取偏移量。