GitHub zabezpiecza na Arktyce swój open-source’owy kod

GitHub to największe na świecie repozytorium oprogramowania, z 37 milionami użytkowników i ponad 100 milionami repozytoriów. Lider w branży technologicznej poszukiwał godnego zaufania rozwiązania dla swoich potrzeb związanych z wiecznych przechowywaniem pamięci masowej.

IDEA

GitHub ma wyraźne spojrzenie na to, z jaką prędkością ewoluuje technologia. Oprogramowanie i sprzęt mogą stać się przestarzałe w ciągu kilku miesięcy, co może utrudnić dostępność cennego kodu źródłowego w przyszłości. Kod źródłowy tworzy podstawę dla przyszłego rozwoju informatyki, która pod wieloma względami jest podstawą cyfrowego świata, jaki znamy. Ponieważ zarówno nasza rzeczywistość staje się coraz bardziej cyfrowa, tak samo nasze dziedzictwo jest bardziej cyfrowe, dlatego też oprogramowanie i kod źródłowy stanowią kluczową część tej historii.

Open-source’owe oprogramowanie jest szczególnie ważne, jako podstawa, na której zbudowano większość software’u. GitHub jest głównym orędownikiem open-source’ego oprogramowania i przywiązuje dużą wagę do tego typu repozytoriów.

Informacje, które powstały w formie cyfrowej, mogą być trudne do utrzymywania. Nowoczesne opcje przechowywania danych są przeznaczone na krótki okres, a informacje mogą być niedostępne już po kilku latach. GitHub zdał sobie sprawę, że sposób, w jaki prowadzili procesy archiwizacji w celu ochrony cennych zasobów kodowych, nie był wystarczający. Chcąc poznać zarówno procesy techniczne, jak i kontekst, w jaki sposób chronić informacje cyfrowe przez dziesięciolecia, a nawet stulecia, a także jak zapewnić dostęp do tych informacji w przyszłości, GitHub zaangażował panel ekspertów.

Do tych ekspertów, znanych jako najlepsi eksperci w cyfrowej archiwizacji, należą Long Now Foundation, Internet Archive, Software Heritage Preservation, Stanford Library i Microsoft Research. W momencie, w którym chodzi o zabezpieczenie światowego dziedzictwa kodu, nic nie jest pozostawione przypadkowi, więc rozważane są tylko najnowocześniejsze rozwiązania, aby sprostać wyzwaniom związanym z zapewnieniem bezpieczeństwa i dostępności kodu źródłowego przez setki lat.

„Cieszymy się, że możemy współpracować z firmą Piql, która pomaga zabezpieczyć oprogramowanie open-source’owe dla przyszłych pokoleń. Technologia archiwizacji piqlFilm pozwoli nam przechowywać terabajty danych na trwałym nośniku zaprojektowanym na ponad 1000 lat. Cieszymy się, że każde publiczne repozytorium GitHub zostanie zapisane na tym nośniku i będzie chronione w Arctic World Archive na Svalbardzie przez wieki dla przyszłych pokoleń”.

REALIZACJA

Koncentrując się głównie na wiecznym przechowywaniu danych, GitHub zaangażował firmę Piql dla jej unikalnej i niezrównanej technologii, która pokonuje problemy innych przestarzałych technologii, zachowując informacje na ponad 1000 lat. GitHub potrzebował również bezpiecznego i zrównoważonego magazynu do przechowywania danych w dodatkowej lokalizacji poza Stanami Zjednoczonymi.

Unikalne podejście Piql do archiwizacji, stworzone na zasadach open-source, aby mieć w przyszłości dostęp do danych, przyniosło gigantowi technologicznemu wiele korzyści. Dzięki pomiarom autentyczności oraz braku potrzeby migracji i niezależności od innych dostawców, piqlFilm gwarantuje to, czego nie potrafi żadna inna technologia. Przede wszystkim oferuje wieczyste zabezpieczenie informacji, będąc całkowicie samowystarczalnym, a także zapewnia, że dane mogą być odczytywane zarówno przez maszyny, jak i ludzkie oko, w dowolnym momencie w przyszłości, niezależnie od upływu czasu.

Ponadto przechowywanie danych w Arctic World Archive (AWA), bezpiecznym, odpornym i zdalnym repozytorium cyfrowej pamięci świata, doskonale wpisuje się w cele GitHub. W AWA przechowywane dane mogą przetrwać ponad 1000 lat, mając zapewniony dostęp do ich odczytu niezależnie od przyszłej technologii.

W jednym z pierwszych depozytów w AWA, GitHub złożył 6000 swoich najważniejszych repozytoriów, zachowując w ten sposób zapis ewolucji technologii i oprogramowania. Ta kolekcja zawiera kod źródłowy dla systemów operacyjnych Linux i Android, języki programowania Python, Ruby i Rust, platformy internetowe Node, V8, React i Angular, kryptowaluty Bitcoin i Ethereum, narzędzia sztucznej inteligencji TensorFlow i FastAI oraz wiele więcej.

W swoim drugim depozycie w AWA, GitHub złożył migawkę każdego aktywnego publicznego repozytorium, zachowując tym samym miliony indywidualnych udziałów. Te dwa depozyty zapewniają łącznie ogólny przegląd rozwoju i wykorzystania open-source’ego oprogramowania we współczesnym świecie.

PLANY

Ponieważ dzisiejszy kluczowy kod już stopniowo staje się przestarzałą ciekawostką historyczną, w każdej chwili może zostać porzucony, zapomniany lub utracony. Co gorsza, choć jest to znacznie mniej prawdopodobne, w przypadku globalnej katastrofy moglibyśmy stracić wszystkie informacje z kilku pokoleń, które zostały zapisane na nowoczesnych nośnikach. Archiwizowanie oprogramowania w różnych formach przechowywania pomaga zapewnić jego długoterminową ochronę.

Piql i GitHub kontynuują współpracę w ramach GitHub Archival Program, wspólnie projektując nowe elementy wieczystej pamięci masowej w ramach projektu Arctic Code Vault.