オープンソースプロジェクトおよびビジネスユースを含む、ソフトウェア開発の開発プラットフォームを提供するギットハブ・ジャパン(本社:東京都港区、以下ギットハブジャパン)は、新型コロナウイルス感染症(COVID-19)がパンデミックを引き起こしている中、世界規模でオープンコラボレーションが活発化していることを受け、GitHub上で活動が展開されている公益性が高いプロジェクトの一部をご紹介します。
従来型のソフトウェアプロジェクトではない多くのオープンコラボレーションが、凄まじい勢いで誕生しています。これらのプロジェクトには、科学者、政府職員、ジャーナリスト、プログラマー、関心を持つ一般市民が、グローバルコミュニティの一員として、COVID-19に対する正しい理解と適切な対処方法の共有を目指し、積極的に取り組んでいます。
異なる立場の人々のコラボレーションによって開発されるこれらのモデルは、データセットのキューレションやDIYのように、自分で開発を進められるテンプレートとしても採用され、世界規模へと広がっています。
情報の追跡、理解、対策を目的とする影響力の大きいオープンソースプロジェクト
●
パンデミック(世界的大流行)の状況追跡で連携
世界屈指の医学部を有するジョンズ・ホプキンズ大学(米国)が提供するオープンデータセット (
https://github.com/CSSEGISandData/COVID-19 )として、最も引用されています。世界中の疫学者、ジャーナリスト、統計学者が、COVID-19の感染拡大に関する正規データソースの1つとし、感染報告をリアルタイムに追跡するためのインタラクティブなダッシュボード(
https://www.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6 )として使用されています。
The Lancet (
https://www.thelancet.com/journals/laninf/article/PIIS1473-3099%2820%2930120-1/fulltext )に掲載された記事によると、このダッシュボードは、「研究者、公衆衛生機関、一般市民向けに、感染症の拡大状況の追跡を可能とし、誰もが使えるツールの提供を目的」として、ジョンズ・ホプキンズ大学のシステムサイエンス・エンジニアリングセンター(Center for Systems Science and Engineering;CSSE)によって開発されました。
さまざまな情報源(主に、DXY)から集められたデータを、WHOをはじめとする他のソースの情報と照合することで検証しています。各国の初感染例に関する情報は、通常、WHOよりも早くこのダッシュボードに伝えられます。ジョンズ・ホプキンズ大学のチームは、適切な対処方法という重要な情報をウイルス感染拡大の早い段階で提供できる点において、このダッシュボードは非常に有効であるとしています。[1]
また、ワシントン大学の保健指標評価研究所 (
http://www.healthdata.org/ ) が提供するnCoV2019(
https://github.com/beoutbreakprepared/nCoV2019 ) も、一般に公開されている高品質データセットの1つであり、こちらのダッシュボード (
https://healthmap.org/covid-19/ ) で閲覧が可能です。このデータセットには、感染症状の発現日や確認日など、各患者の詳細なデータが含まれており、COVID-19の再生産数や潜伏期間など、重要な統計データを導くために使用されています。[2]
●
米国内での感染追跡
米国内の検査率や感染率について、最も包括的な情報提供を行っているのがCOVID-19 Trackerプロジェクト(
https://covidtracking.com/ ) です。[3,4] このプロジェクトのデータは、ウェブページ(
https://covidtracking.com/data/ ) やGoogleシート (
https://docs.google.com/spreadsheets/u/2/d/e/2PACX-1vRwAqp96T9sYYq2-i7Tj0pvTf6XVHjDSMIKBdZHXiCGGdNC0ypEU9NbngS8mxea55JuCFuua1MUeOj5/pubhtml# ) 、またはパブリックAPIを介して閲覧することができます。このプロジェクトは、3月初旬にアメリカ疾病管理予防センター(CDC)から検査情報が発表されない(
https://www.theatlantic.com/health/archive/2020/03/how-many-americans-have-been-tested-coronavirus/607597/ ) 事態を懸念したRelated Sciencesの創設者と、The Atlanticとの業務提携からスタートしました。
両社はボランティアを公募し、各州のウェブサイトをクロールしてデータを集約し、APIを介してデータセットを一般公開するためのソフトウェアパッケージ一式 (
https://covidtracking.com/software/ ) を短期間で開発しました。プロジェクトは速やかに進められ、ソースコードとデータセットが共有されました。以前、Our World in Data (
https://ourworldindata.org/ ) のCOVID-19検査 (
https://ourworldindata.org/covid-testing ) に関するページには、CDCが発表するデータとCOVID19 Trackerのデータの両方が掲載されていましたが、現在ではCOVID19 Trackerのデータのみが掲載されています。
●
大規模調査のためのボランティアコンピューティング
ワクチンや治療法の発見を目的とした科学的な研究が進んでいます。コンピューターによる医薬品の設計を始めとして多岐にわたるプロジェクト「Folding@home (
https://foldingathome.org/ )」があります。ここでは、ボランティアからインターネットを介して提供されるPCの計算処理能力を利用し、分子動力学モデリングを行う分散コンピューティングを推進しています。
COVID-19 (
https://foldingathome.org/2020/03/10/covid19-update/ )の創薬標的候補としてタンパク質に的を絞った取り組みを進めている同プロジェクトのデータは、こちらのレポジトリ (
https://github.com/FoldingAtHome/coronavirus ) に保存されています。オープンソースプロジェクトとして、そのデータセットやソフトウェアは、すべて公開されています。
●
一般向けサポート
世界保健機関(WHO)のアプリチーム (
https://github.com/WorldHealthOrganization/app )が、COVID-19と戦う世界中の人々をサポートするためのモバイルアプリの初版開発が急ピッチで進められています。ユーザーの居住地域情報を提供するだけでなく、その他のユーザーにも正確な情報を伝えるため、公衆衛生当局へのフィードバック機能を備えたアプリの開発を目指しています。
●
科学的対策の迅速な適用
ウイルスを疫学的に理解し、大規模な感染拡大を防ぐ対策の強化を目指し、病原体ゲノムを追跡および解析するためのオープンソースプロジェクト、Nextstrain (
https://nextstrain.org/ ) 。COVID-19の遺伝疫学的データを提供するダッシュボード(
https://nextstrain.org/ncov ) は、ヒト コロナウイルス(HCoV-19)の突然変異に関わる進化的関係を示すものです。同プロジェクトのウェブサイトには、「現在の科学出版のあり方では、疫学的に有意な結果が迅速に流布されない」と明記されており、同チームは質の高いデータを素早く提供し、パンデミックの発生によるダメージを最小限に抑えることに尽力しています。NextstrainのCOVID-19関連ダッシュボードでは、厳しい共有ガイドラインが定められているものの、GISAID (
https://www.gisaid.org/ ) のデータが使用され、ソフトウェアはすべてがオープンソース (
https://github.com/nextstrain ) です。
他にも、こちらの胸部X線写真レポジトリ(
https://github.com/ieee8023/covid-chestxray-dataset ) のように、診断の精度を上げ、感染予測をサポートするAIの開発を目的とした小規模な科学的データセットも多く存在します。
●
データの可視化
COVID-19に関する科学データの可視化を目的とする多くの小規模プロジェクトが進行しています。
- Novel Coronavirus Infection Map(新型コロナウイルス感染症の拡散状況マップ)(https://github.com/jakobzhao/virus ) : 世界的な感染拡大の履歴だけでなく、各国の感染状況も視覚的に表示します。このマップは、ワシントン大学のHumanistic GIS Labが開発したもので、多数の政府組織や公衆衛生機関から取得したデータが反映されています。
- Novel Coronavirus Infection Map(新型コロナウイルス感染症の拡散状況マップ)( https://github.com/jakobzhao/virus ) :世界的な感染拡大の履歴だけでなく、各国の感染状況も視覚的に表示します。このマップは、ワシントン大学のHumanistic GIS Labが開発したもので、多数の政府組織や公衆衛生機関から取得したデータが反映されています。
- COVID-19 Dashboards:ジョンズ・ホプキンズ大学のCOVID-19データをインタラクティブに表示するダッシュボードです。Jupyter Notebooksで構築され、fastpages( https://fastpages.fast.ai/ ) を使ってブログに変換されています。COVID-19 Dashboardsのデータセットは、GitHub Actionsによって最新状態に保たれているため、最新情報が常に視覚化されています。このサイト全体が、ボランティアのプログラマーやデータサイエンティストによってオープンソースで構築されています。このサイトには可視化情報に加え、予測モデルのソースコードを直接調べることができるため、オープンソースのアプローチに適しています。(fastpagesは生成されたウェブページに直接埋め込まれたソースコードを表示します)
COVID-19関連データへのプログラマティックなアクセスを簡素化するため、このような(
https://github.com/mathdroid/covid-19-api ) 多数のプロジェクトが開発されました。ジョンズ・ホプキンズ大学のデータを提供するAPIで多く存在し、COVID-19関連情報を可視化したサイトも作られ、リアルタイム情報が可視化するレスポンシブルデザイン対応のサイトが20件近く (
https://blog.datawrapper.de/coronaviruscharts/ ) 誕生しています。
●
国家、州、自治体、コミュニティ(イタリア、武漢、東京、チューリッヒのプロジェクト)
イタリアは、COVID-19に関する国内の最新データ (
https://github.com/pcm-dpc/COVID-19 ) をすべて共有しています。イタリア全土の感染状況をリアルタイムに追跡するダッシュボードも、このデータを利用しています。同様に、東京 (
https://github.com/tokyo-metropolitan-gov/covid19 ) やチューリッヒ(
https://github.com/openZH/covid_19 ) などのさまざまな大都市が、GitHubのレポジトリを介して、感染情報をリアルタイムに保存、共有されています。
武漢2020コミュニティプロジェクト(
https://community.wuhan2020.org.cn/zh-cn/ )は、「このウイルスとの戦いに貢献するすべての人々のために、病院、工場、調達、その他の情報をリアルタイムに同期させるデータサービスの確立」を目指した自立的なオープンソースのコミュニティプロジェクトです。
●
人工呼吸器のDIY(自作)
最後に、Low-Cost Open-Source Ventilator(
https://github.com/jcl5m1/ventilator )プロジェクトは、低コストで人工呼吸器を製作する方法として、幅広い情報を提供しています。医療機関で標準的な人工呼吸器が不足した場合、これが人々の命を救うことになるかもしれません。
COVID-19プロジェクトのためのGitHubのサポート
GitHubは、このように多くのコントリビューターが互いのコミュニティにおいて協力し合い、COVID-19の感染拡大防止と戦うための対策を講じている行動に、大変感銘を受けています。既に、1日あたり60,000時間分の計算能力を、GitHubからFolding@homeに提供しています。他のプロジェクトにもサポートを提案しています。COVID-19関連プロジェクトでGitHubの製品やサービスが必要な方は、プロジェクトに関する情報と共に、GitHubに依頼したい内容を添えて、 弊社までお問い合わせ(
https://mail.google.com/mail/u/0/?view=cm&fs=1&tf=1&source=mailto&to=covid19requests@github.com )ください。
[1] John Hopkins: COVID-19 Map FAQs
https://systems.jhu.edu/research/public-health/2019-ncov-map-faqs
[2] Our World in Data: nCoV-2019 Data Working Group data
https://ourworldindata.org/coronavirus#n-co-v-2019-data-working-group-data
[3] Talking Points Memo: Key Source of COVID-19 Testing and Infection Data
https://talkingpointsmemo.com/edblog/key-source-of-covid-19-testing-infection-data
[4] The Atlantic: How to Understand Your State’s Coronavirus Numbers
https://www.theatlantic.com/technology/archive/2020/03/how-understand-your-states-coronavirus-numbers/607921
/////////////////////
翻訳版の日本語版ブログ全文は、こちらをご覧ください。
https://github.blog/jp/2020-04-02-open-collaboration-on-covid-19/
英語版オリジナルは、こちらからご覧ください。
https://github.blog/2020-03-23-open-collaboration-on-covid-19/
GitHubに関する情報は、こちらからもご覧いただけます。
Blog: (英語)
https://github.blog/ (日本語)
https://github.blog/jp/
Twitter: (英語) @github(
https://twitter.com/github )
(日本語) @GitHubJapan(
https://twitter.com/githubjapan )
【ギットハブについて】
https://github.co.jp
GitHubは世界で4,000万人にのぼる開発者および210万の組織に利用される開発プラットフォームです。プログラミング環境にオープンな会話と協調を重んじるコミュニケーションによって、コラボレーションを促進する開発環境を提供しています。これらの開発を実現するワークフローで必要となるコードレビュー、プロジェクトおよびチームマネージメント、ソーシャルコーディング、ドキュメント管理などに、これまで以上の効率性と透明性をもたらし、より高速かつ品質の高いソフトウェア開発を支援しています。
GitHubは多様なユースケースに適した開発プラットフォームを用意しており、オープンソースジェクトから企業における機密性の高いソフトウェア開発までに対応できます。無料で利用できるパブリックリポジトリはオープンソースプロジェクトにて多く利用されていますが、プライベートリポジトリが利用できる有償サービス、GitHub EnterpriseやBusiness on GitHub.comなども提供しています。
2008年に米国サンフランシスコで創業したGitHub, Inc.は、初の海外支社として、2015年に日本支社を開設しました。