2

我有许多记录(=< 100),其中包含大量文本,需要在以可重复使用的文件格式存储之前进行标记(语义:列表、标题、表格、链接、引用等)。

存储后,它可能在未来尽可能多的时间内或多或少地保持不变。

它包含一些非ascii,因此需要UTF-8。我开始使用 HTML,然后考虑使用 Markdown ......但想知道人们认为什么是最适合长期存储的未来标记格式?内容最初用于(大部分是静态的)网站,但可以用作其他输出的内容。

最后,关于长期使用的存储选择的意见- 数据库,单独的文档......?对记录的更改很少,并且只有 1-3 人可以编辑,并且读取权限应该会随着时间的推移而增加。


更新:

我最终选择了 MultiMarkdown 、 PHP Markdown Extra 和 Kramdown 之间的共同特征(例如表格)作为文本格式Markdown省略了太多的 HTML 标记),并使用 Kramdown 将生成的文件转换为 html。现在我正在尝试可以处理扩展 Markdown 并通过 Dropbox 同步到我的桌面/笔记本电脑的iOS Markdown 编辑器。

4

1 回答 1

1

任何不是为长期归档而设计的存储都会损坏

这不是数据库与文件系统的问题,而是如何确保不会发生(静默)数据损坏以及如何迁移数据。我不能给你明确的答案,因为它取决于很多因素(包括成本),但这里有一些资源:

对于格式问题,我没有真正的答案,但我认为 HTML + UTF-8 即使在几十年后也应该可读,但要记录下来。

于 2011-11-11T15:35:43.263 回答