软件会过时,但数据不必
在软件的世界里,变化是不断的。
企业兴衰,软件应用也是如此。
当软件得到更新、废弃或停止存在时,它产生和处理的数据可能无法再次访问,这通常发生在它使用非可移植、专有或复杂的数据格式时,如.doc(x)
、.xls(x)
、.psd
,许多(如果不是大多数)数据格式都属于这一类别。
有些软件保持良好的向后兼容性1,可能已经存在很长时间,但数据可移植性仍然是一个问题。 例如,Microsoft Office无法保证随着时间的推移的无缝兼容性,旧的docx文件通常在现代Office版本中无法被识别,平台差异进一步复杂化了问题。
未来保障您的数据
为了确保数据可移植性、长寿和未来保障,数据格式的复杂性应尽量低。
这意味着,格式的规范应该易于理解,使理解它的应用程序的实现相对简单。这反过来增加了将来成功检索数据的可能性。
我信任的是一种通用且唯一的数据格式:纯文本。
与其他格式不同,它在时间、设备和操作系统之间保持可靠和可访问2,有许多关于纯文本的赞美之词3,如果您还没有爱上它,请查阅其中任何一篇。
在处理多媒体时,我更喜欢在可能的情况下避免它们。 然而,在必要时,我选择像TIFF、PNG这样的图像简单格式,以及WAV这样的音频简单格式。
结论
我并不是说人们应该停止使用复杂的数据格式,而是要设定这样的期望:它可能不会持续很长时间。
拥抱纯文本和其他简单、被广泛采用4的格式是每个人都可以采取的一步,以保护他们的数据免受软件波动的影响,并确保将来可以访问数据。
这个主题在 The Zettelkasten Manual 中有进一步讨论。
-
现代的Windows 10可以运行20年前为Windows 95或NT4编译的二进制文件。Windows如何保持20多年的二进制兼容性? ↩
-
你可以在为实际使用而制作的任何操作系统上找到(纯)文本编辑器。几十年前的设备可以读写纯文本。 ↩
-
这是一个好例子:写纯文本文件 - Derek Sivers ↩
-
要考虑更多方面:公开标准化、无限制、良好文档化和自文档化。 ↩