O movimento open source mudou a indústria do desenvolvimento de software. Nas últimas décadas, criamos soluções incríveis. Mas como podemos garantir que todo esse esforço e revolução não seja perdido em casos extremos, como catástrofes, ou até mesmo o esquecimento do que foi feito na história ao longo dos anos? O GitHub tem um plano bem megalomaníaco para isso.

GitHub irá enviar todo o código público open source para um cofre no Ártico

Em 2 de fevereiro de 2020, o GitHub irá enviar todo o código público open source para um cofre no Ártico com objetivo de preservação de mil anos 😮😮😮 Isso mesmo, o GitHub Arctic Code Vault é um repositório de dados preservado no AWA (Arctic World Archive).

O mundo é alimentado por software open source

Linux, Android, Node.js (e seus milhões de módulos), Python, Rust, etc. são ótimos exemplos que sustentam a afirmação do GitHub de que o mundo é alimentado por código aberto.

É um pilar escondido da civilização moderna e a herança compartilhada de toda a humanidade. A missão do programa GitHub Archive é preservar o software de código aberto para as gerações futuras.

Realmente, talvez nem todo mundo saiba, mas software open source é uma das bases da tecnologia. Até mesmo a Microsoft vem investindo cada vez mais no mundo open source – o que era impensável anos atrás.

E o GitHub não está sozinho nessa. Essa é uma grande parceria com Long Now Foundation, the Internet Archive, the Software Heritage Foundation, Arctic World Archive, Microsoft Research, the Bodleian Library, e Stanford Libraries.

Mas o que é o AWA?

O AWA é um lugar nas profundezas das montanhas do Ártico (250 metros), mais precisamente no arquipélago de Svalbard, Noruega. Um fato interessante é que Svalbard é uma zona de economia livre e desmilitarizada. Isso faz com que o lugar seja propício para o armazenamento seguro. O lugar é basicamente o melhor local no mundo para mantermos nossa herança digital para as futuras gerações, e é exatamente isso que o GitHub quer fazer com todo código open source já criado até os dias atuais.

Arctic World Archive

Em 2 de fevereiro de 2020, o GitHub fará um snapshot de todos os repositórios públicos no GitHub e armazenar nesse cofre. Legal, não? Na prática, isso quer dizer que todos projetos open source que vocês já fizeram até hoje e que estão no GitHub, serão guardados para as gerações futuras. Não tem nenhum projeto criado ainda? Tá aí uma boa oportunidade!

Como será feito?

A estratégia é utilizar o LOCKSS (Lots Of Copies Keeps Stuff Safe) que se baseia no conceito de “Múltiplas formas de armazenamento”. Essa técnica é utilizada justamente para não se perder dados de jeito nenhum.

Mas como garantir que essas informações salvas sejam úteis no futuro? Com a curadoria de Stanford, os dados salvos também contarão com metadados, incluindo informações culturais, contexto, etc. Sendo assim, no futuro, pessoas que tenham acesso ao montante de dados conseguirão de fato entender e usar.

Mas qual é a estratégia? O conhecimento humano é armazenado em diferentes tipos de mídias hoje: CDs, HDs, SSDs, fitas. O GitHub quer armazenar esses dados usando algo mais confiável.

Vamos ver o que será feito pelo GitHub e parceiros no projeto:

🚀 GitHub A cada push no GitHub, os dados do Git serão replicados para múltiplos datacenters no mundo.

🚀 GHTorrent O GHTorrent monitora a timeline de eventos públicos do GitHub, arquiva esses eventos, rastreia e arquiva recursivamente seus conteúdos e dependências. Esses arquivos são disponibilizados para download diariamente ou mensalmente.

🚀 GH Archive O GH Archive monitora a timeline pública do GitHub, arquiva os eventos e os torna consultáveis usando o BigQuery. Você também pode baixar instantâneos por hora, dia ou mês.

🚀 Internet Archive O conhecido Wayback Machine do Internet Archive rastreará os repositórios públicos do GitHub (incluindo novos repositórios, issues, PRs, wikis e muito mais) e armazenará cópias em discos rígidos em São Francisco e outros locais. Esses arquivos estarão disponíveis ao público via git e https.

🚀 Software Heritage Foundation A Software Heritage Foundation rastreará o GitHub regularmente e adicionará seus repositórios públicos ao seu arquivo, ao qual eles fornecem acesso público à API.

🚀 Bodleian Library A Biblioteca Bodleian da Universidade de Oxford fornecerá redundância para o Arctic Code Vault, mantendo os 10.000 repositórios mais estrelados e mais dependentes do GitHub em seu depósito usando bobinas de filme Piql duplicadas.

🚀 Arctic world archive Em 2 de fevereiro de 2020, o GitHub capturará um snapshot de todos os repositórios públicos ativos, a serem preservados no Arctic Code Vault do GitHub. Esses dados serão armazenados em bobinas de filme de 3.500 pés, fornecidas e codificadas pela Piql, uma empresa norueguesa especializada em armazenamento de dados em longo prazo. A tecnologia do filme baseia-se em halogenetos de prata em poliéster. Este meio tem uma vida útil de quinhentos anos, conforme medido pela ISO; testes de envelhecimento simulados indicam que o filme de Piql vai durar o dobro do tempo.

[E agora o mais legal e mind blowing 💥] 🚀 Project Silica from Microsoft Research O GitHub Archive Program está em parceria com o Project Silica da Microsoft para arquivar todos os repositórios públicos ativos por mais de dez mil anos, gravando-os em pratos de vidro de quartzo usando um laser de femtossegundos.

O que ficará no snapshot?

Os dados de todos os repositórios públicos (como dito anteriormente) + metadados. Será armazenado o “HEAD” do repositório GIT da branch padrão. Arquivos binários maiores que 100KB não serão armazenados. Cada repositório se tornará um arquivo .TAR no final. Um índice de fácil compreensão também será incluído com instruções de como recuperar os arquivos.

Conselheiros e conselheiras do projeto

Um projeto assim de longo prazo precisa de especialistas de diversas áreas. Veja abaixo o time de consultores e suas respectivas áreas de atuação.

  • Shannon Lee Dawdy (Archaeologist / Anthropologist / Historian)
  • Brewster Kahle (Internet Archive)
  • John McWhorter (Linguist)
  • Alexander Rose (Executive Director, Long Now Foundation)
  • Ada Palmer (Historian / Science Fiction Author)
  • Hussein Bassir (Archaeologist / Egyptologist / Director of the Antiquities Museum at the Library of Alexandria)
  • Christine Moran (Computational Astrophysicist / Security Engineer)
Consultores do projeto

Conclusão

Particularmente, achei essa iniciativa incrível! Tantas empresas e organizações se unindo para que em um futuro distante nada que já foi feito seja perdido é muito legal. Parabéns e obrigado ao GitHub e parceiros por tornar o meu código (e alguns bugs) “imortal” e acessível para as próximas gerações!

Autor(a)

Jaydson Gomes
87  Posts
Jaydson Gomes trabalha com tecnologia desde o início dos anos 2000 e é​ desenvolvedor de software especializado em JavaScript.
​É sócio fundador da Nasc e da ​BrazilJS e curador/idealizador da ​BrazilJS Conf, uma das maiores conferências do mundo sobre a linguagem JavaScript.
É editor da Newsletter BrazilJS Weekly e host do show BrazilJS Weekly no YouTube.
Jaydson também é autor e editor no portal BrazilJS e escreve em seu blog pessoal.
É um entusiasta open source e tem apresentado diversas palestras ao longo dos últimos anos, em sua grande maioria falando sobre JavaScript e tecnologias Web.