Preserving open source software for future generations.
世界由开源软件驱动,GitHub存档程序为后代保留开源软件而建。
GitHub is partnering with the Long Now Foundation, the Internet Archive, the Software Heritage Foundation, Arctic World Archive, Microsoft Research, the Bodleian Library, and Stanford Libraries to ensure the long-term preservation of the world's open source software. We will protect this priceless knowledge by storing multiple copies, on an ongoing basis, across various data formats and locations, including a very-long-term archive designed to last at least 1,000 years. GitHub与Long Now基金会、Internet Archive、软件遗产基金会、Arctic World Archive、Microsoft Research、Bodleian图书馆和斯坦福图书馆合作,为保证世界开源软件的长期保存设计一款可保存1000年的长期存档软件。我们将通过不断地跨各种数据格式和位置存储多个副本来保护开源代码,可保存至少1000年。
为什么创建GitHub存档程序?
当今天的重要代码成为昨天的历史时,那么离它被遗忘或丢失的日子也就不远了。在爆发全球大灾难的时候我们可能会丢失存储在现代媒体上的一切资料,跨多个组织和存储形式的归档软件利于数据资料的长期存储。
目前,世界上很多知识都存储在暂时性媒体上,像硬盘、固态硬盘、CD、备份磁带,即使严格控制这些存储设备存放环境的湿度和热度,它们的寿命仍很有限,像备份磁带的寿命仅有30年。The GitHub Archive Program will include much longer-term media to address the risk of data loss over time. GitHub存档程序将包括许多长期介质,可以降低随着时间推移数据丢失的风险。未来人们可以从开源项目中了解我们曾经使用过的代码。在这个未来中,今天的软件很可能被看作是一个古雅而被遗忘已久且无关紧要的东西,直到出现对它的意外需求。与任何备份一样,GitHub存档程序也适用于当前不可预见的未来。
A flexible, durable strategy for archiving code.
我们采用一种“速度层”策略来归档代码,其灵感源于Steward Brand,该方法旨在通过提供一系列存储解决方案,从实时存储到长期存储,最大限度地提高灵活性和耐久性。存档程序分为hot、warm、cold三种,Hot: Near real-time;Warm: Updated monthly to yearly;Cold: Updated every 5+ years。
每次访问GitHub,我们都会将用户的Git数据复制到世界各地多个数据中心。此外,我们将Git数据、问题、拉取请求和所有数据的备份存储在GitHub的多个位置。所有这些数据都可以通过GitHub API实时获得……
存在哪里?北极世界档案馆
GitHub Arctic Code Vault是一个数据存储库,存储在北极世界档案馆(AWA)中,这是一个长期的档案设施,位于北极山永久冻土区深250米。GitHub将在2020年2月2日捕获每个活动公共存储库的快照,并将这些数据保存在Arctic Code Vault中。这个北极存储库可以持续多少年?1000年。AWA致力于永久保存档案,要知道它已保存来自意大利、巴西、挪威等多个国家的历史和文化数据。
如何确保未来使用这些存储的代码或软件?
GitHub将召集一个GitHub档案项目咨询小组,包括人类学、考古学、历史、语言学、档案科学、未来主义等方面的专家,就档案中应包括哪些内容以及如何与继承人进行最佳沟通向我们提出建议。一千年已是很长一段时间,尽管如此,仍考虑并计划在今后1000年中有广泛的可能性。这个计划建立在我们今天的最佳想法之上。存储档案的介绍包括QR解码、文件格式、字符编码和其他关键元数据的技术指南,以便将原始数据转换回源代码供未来其他人使用。
当代没有什么软件可以运行到未来,那么档案馆和技术树可能极具价值。但这个价值可能是历史性的,也许只能确保今天的技术不会被一个不经意认为无关紧要的明天丢失,直到被发现和意外使用。
GitHub启动代码永存计划,旨在为后代保留开源软件,他们还打算让GitHub归档程序证明开源社区的重要性,并希望这一计划会进一步宣传世界范围内的开源运动,促进更多地区加入开源活动。
推荐阅读:高性价比笔记本