GitHub Archive Program、オープンソースソフトウェアのソースコードを未来へ継承するプロジェクト 21TBにのぼるリポジトリデータを北極圏に1000年間保管

ギットハブ・ジャパン合同会社


オープンソースプロジェクトおよびビジネスユースを含む、ソフトウェアの開発プラットフォームを提供するGitHub, Inc.(本社:米国サンフランシスコ、以下ギットハブ)は7月16日(米国時間)、オープンソースソフトウェア(OSS)を次世代へと引き継ぐプロジェクトGitHub Archive Program ( https://archiveprogram.github.com/ ) のもと、7月8日に21TBにのぼろリポジトリデータを北極圏への保管を完了したことを発表しました。

ソースコードを北極圏で安全に保管
GitHub Universe 2019( https://github.blog/jp/2019-11-14-universe-day-one/ ) において、GitHub Arctic Code Vault ( https://www.youtube.com/watch?v=fzI9FNjXQ0o ) を含むGitHub Archive Program ( https://archiveprogram.github.com/ ) というプロジェクトを発表しました。GitHubの使命は、世界の人々によって開発されたソースコードを1000年間アーカイブ(保管)し、オープンソースソフトウェアを次世代へと引き継ぐことにあります。

2020年2月2日、vault(貯蔵庫)内にアーカイブ保存するためのソースコードとして、GitHub上に公開済みであるすべてのアクティブなパブリックリポジトリのスナップショットを取得しました。GitHubのアーカイブパートナーであるPiql ( https://www.piql.com/ ) が、数ヶ月間を費やし21TBものリポジトリデータを186リール(巻)のpigFilm(デジタル感光性アーカイブフィルム)に転写しました。当初の計画では、GitHubチームがノルウェーの現地へ飛び、世界のオープンソースコードを北極圏まで直接持参することを予定していましたが、COVID-19の状況から、この計画の調整が余儀なくされました。

GitHubは、この計画のパートナーと緊密に連絡を取りつつ、ノルウェーのスヴァールバル(Svalbard)へ安全に輸送できるタイミングを図り、遂に7月8日にコードをArctic Code Vaultに無事保管を完了しました。

ソースコードを北極圏へ届けるという旅の様子や、保存に至るまでにGitHub Archive Programに生じた出来事のいくつかをご紹介させていただきます。 

世界のオープンソースコードを北極圏へ届ける旅  

皆さんのコードの旅は、ノルウェーのドランメン(Drammen)にあるPiqlの施設から始まりました。ここから186にのぼるフィルムリールを収めた箱がオスロ空港に到着し、スヴァールバル行きの旅客機の貨物として積み込まれました。ヨーロッパ本土から約600マイル(約1000km)北に位置するスヴァールバルは、シェンゲン協定加盟国や欧州経済地域内の各国からの旅行者を、つい最近受け入れ始めたところ ( https://en.visitsvalbard.com/visitor-information/visit-svalbard-refrain-from-travelling-covid-19 ) です。



コードが収められた箱は、スヴァールバルにある人口数千人の町、ロングイェールビーン(Longyearbyen)に到着後、地元の物流会社により一晩安全に保管できる中継保管施設に搬送されました。翌朝、すでに閉鎖されている山中の炭鉱に移され、さらに永久凍土の地下数百メートルに設置された vault (貯蔵庫) に格納されました。ここが、世界のオープンソースコードを1000年間保存するという使命を果たすための安住の地となります。



Arctic Code Vault バッジのご紹介   

数百万人におよぶ世界中の開発者が、今回 Arctic Code Vault に保管されたオープンソースソフトウェアに様々な形で貢献しています。このような開発者の貢献を評価とともに称えるため、Arctic Code Vault バッジを作成しました。このバッジはGitHub上の開発者プロフィールにあるハイライトセクションに表示されます。マウスでポイントすると、各開発者が貢献したリポジトリの一部が表示されるようになっています。


Archive Program パートナーからの更新情報 

Internet Archive (インターネットアーカイブ)
Internet Archive (IA) ( https://archive.org/ ) は、デジタル資料コレクションへのパブリックアクセスを無償提供することで著名な非営利デジタルライブラリです。GitHub Archive Programと提携し、IAは本年4月13日にGitHubパブリックリポジトリの継続的アーカイブを開始しました。現在、IAは2つの方法で展開されています。一つ目の方法は、よく知られているWayback Machineにより、GitHubのRAWデータにアクセスし、WarcまたはWeb ARChiveファイルにアーカイブすることです。本記事の執筆時点で、約55TBのデータがアーカイブ済みです。二つ目の方法は、IAがアーカイブされたGitHubリポジトリ全体を「git clone」経由で利用できることを目標に、リポジトリのコメント、issue、その他のメタデータにウェブ上から簡単にアクセスできるようにすることです。この2番目の取り組みは順調に進んでおり、今月中に最初のアーカイブが開始される予定です。

Software Heritage Foundation (ソフトウェア遺産財団)
Software Heritage( https://www.softwareheritage.org/ ) は、Inriaがユネスコとの提携により立ち上げた非営利マルチステークホルダーの取り組みとしてソフトウェアコモンズのソースコード収集、保存、共有することを目的としています。すでに1億3,000万件以上のプロジェクトがアーカイブされ、開発履歴も完備していますが、そのうちの1億件ものプロジェクトがGitHub発となっています。GitHub Universe 2019で発表したコラボレーションにより、アーカイブエンジンはGitHubの成長スピードに見合うことを目標として改善が進行中です。。 興味のあるプロジェクトや最新バージョンがまだアーカイブされていない場合でも、下記サイトで数回クリックするだけで簡単にアーカイブが開始されます。
https://save.softwareheritage.org 
 
Project Silica (プロジェクト シリカ)
Project Silica ( https://www.microsoft.com/en-us/research/project/project-silica/ ) は、長期間有効なデータを格納するクラウド規模のストレージとして、媒体(メディア)から設計と構築が行われたストレージテクノロジーを開発しています。最新の超高速レーザー光学技術を活用し、ガラス材料の物理的構造を永久的に変化させるプロセスを経て、データを石英ガラスに保存します。石英ガラスは、数万年以上にわたるデータ寿命を提供できる耐久性をもつストレージメディアです。 電磁干渉、水、熱に対する耐久性があるため、世界のオープンソースソフトウェアを将来の世代のために永久保存するための理想的なストレージメディアです。 GitHub Archive Program ( https://archiveprogram.github.com/ ) のパートナーであるProject Silicaは、ストレージのイノベーションを推進し、世界の長寿命データのための持続可能で信頼性の高いストレージ技術の必要性に応えるストレージ技術の開発に取り組んでいます。 将来のアーカイブの概念実証として、世界で最も人気のある6,000のリポジトリをアーカイブしました。


次のステップ 
コード、文化、歴史、技術:Tech Tree
アーカイブされたすべてのリールには、GitHubコミュニティに寄せられた投稿に基づき、5つの言語で記載された「GitHub Code Vault ガイド」が同梱されています。 このガイドは、アーカイブプログラムのGitHubリポジトリからも入手可能です。さらに、アーカイブには、その内容に関する技術史および文化的背景を人間が読み取れる形式で文書化した別のリールも含まれています。GitHubは、これをTech Treeと命名しました。

Long Nowによる「Manual for Civilization」に触発されたTech Treeは、現代のコンピューティング、オープンソースとそのアプリケーション、現代のソフトウェア開発、よく使われるプログラミング言語などに関する深い理解のため、既存の作品を中心に選び構成されています。また、ソフトウェアを形作る技術基盤の様々なレイヤーを解明する作品も含まれ、マイクロプロセッサ、 ネットワーク、 エレクトロニクス、半導体、さらには産業革命以前の技術に至るまでのものが対象となっています。これにより、アーカイブを継承する未来の人々は、今日の世界とその技術をより深く理解することが可能になります。アーカイブされたソフトウェアを使用するためのコンピュータの再作成も可能かもしれません。

世界の文化的背景と技術史をカプセル化するということは困難な試みではありますが、GitHubははTech Treeがこれからも進化を継続していくことを期待しています。まもなくArchive ProgramのGitHubリポジトリに、Tech Tree用に選んだ作品リストのごく初期的なバージョンを公開する予定です。もちろん、コミュニティへの投稿についてのリクエストも同時に行います。Tech TreeのArctic Code Vaultへの追加に向けて、GitHubコミュニティからのアイデアや提案を募集しています。

GitHub Blog
英語
https://github.blog/2020-07-16-github-archive-program-the-journey-of-the-worlds-open-source-code-to-the-arctic/
日本語
https://github.blog/jp/2020-07-20-github-archive-program-the-journey-of-the-worlds-open-source-code-to-the-arctic/


GitHubに関する情報は、こちらからもご覧いただけます。
Blog: (英語) https://github.blog/  (日本語) https://github.blog/jp/
Twitter: (英語) @github( https://twitter.com/github )      
     (日本語) @GitHubJapan( https://twitter.com/githubjapan )


【ギットハブについて】https://github.co.jp
GitHubは世界で5,000万人にのぼる開発者および290万の組織に利用される開発プラットフォームです。プログラミング環境にオープンな会話と協調を重んじるコミュニケーションによって、コラボレーションを促進する開発環境を提供しています。これらの開発を実現するワークフローで必要となるコードレビュー、プロジェクトおよびチームマネージメント、ソーシャルコーディング、ドキュメント管理などに、これまで以上の効率性と透明性をもたらし、より高速かつ品質の高いソフトウェア開発を支援しています。
GitHubは多様なユースケースに適した開発プラットフォームを用意しており、オープンソースジェクトから企業における機密性の高いソフトウェア開発までに対応できます。無料で利用できるパブリックリポジトリはオープンソースプロジェクトにて多く利用されていますが、プライベートリポジトリが利用できる有償サービス、GitHub EnterpriseやBusiness on GitHub.comなども提供しています。
2008年に米国サンフランシスコで創業したGitHub, Inc.は、初の海外支社として、2015年に日本支社を開設しました。

その他のリリース

話題のリリース

機能と特徴

お知らせ