「例外」を発見するAI「BLOX」の開発 -AIを用いた革新材料の開発に新たな道筋-
これまでに材料開発を飛躍的に発展させてきた要因は、予想や想定ができない、いわば例外の発見でした。しかし既存のAIでは、人間が望む材料特性を予め設定することで新材料を開発してきており、例外的な物質を探すことはできませんでした。
今回、共同研究チームは、機械学習[1]をうまく組み合わせることで例外の度合いを数値化し、例外的な物質を効率的に発見するAIを開発し、「BLOX」と名付けました。BLOXを検証するために、量子力学に基づいた分子シミュレーション技術[2]と組み合わせた結果、例外的な光吸収特性を持つ有機化合物候補を多数発見しました。そのうちの8個を実際の化合物で評価したところ、250ナノメートル(nm、1nmは10億分の1メートル)以下や450nm以上の波長の光を強く吸収する例外的な特性を持つことを確認できました。このような化合物は、色素や有機太陽電池[3]などの機能性材料として有用です。
本研究は、科学雑誌『Chemical Science』の掲載に掲載されました。(5月28日付:日本時間5月28日)
BLOXに基づく例外的な光吸収特徴を持つ化合物の探索結果(橙色)
※共同研究チーム
横浜市立大学
大学院生命医科学研究科 准教授 寺山 慧(てらやま けい)
(研究当時:理化学研究所 革新知能統合研究センター 分子情報科学チーム 特別研究員)
理化学研究所 革新知能統合研究センター 分子情報科学チーム
特別研究員 隅田 真人(すみた まさと)
チームリーダー 津田 宏治(つだ こうじ)
(物質・材料研究機構 統合型材料開発・情報基盤部門 NIMS招聘研究員)
物質・材料研究機構
国際ナノアーキテクトニクス研究拠点
主幹研究員 石原 伸輔(いしはら しんすけ)
主任研究員 田村 亮(たむら りょう)
NIMSポスドク研究員 マンディープ・カウル・チャハル(Mandeep Kaur Chahal)
若手国際研究センター
ICYS研究員 ダニエル・トニー・ペイン(Daniel Tony Payne)
1.背景
新たな研究領域を切り開くきっかけとなる物質や材料は、しばしば「例外」的なものです。この世界に存在する物質は非常に多様ですが、それらの物理的・化学的特性に注目すると、多くの場合さまざまな傾向や偏りが存在します。例えば、有機太陽電池の有機材料では、電圧と電流にトレードオフの関係があります。つまり、高電圧を示す材料では電流が低くなり、逆に高い電流値を狙った材料では電圧が低くなります。また、有機発光ダイオード[4]に用いられる有機分子には、発光効率が高いほど寿命が短くなる傾向があります。これらの関係に反する物質は非常に有用であり、その開発に多くの労力が費やされています。
これらの例に限らず、複数の特性を考慮した上で例外的な特性を持つ物質を効率的に発見できれば、かつてない機能を持った材料や新たな基礎研究の端緒を開く可能性があります。しかし、これまでこのような例外的物質の発見は、ほとんど偶然に任せるしかありませんでした。
一方、近年、機械学習などに基づく人工知能(AI)を用いた新物質・材料設計が盛んに行われています。AIの設計では、目標となる特性を予め設定する必要があります。しかし、この弊害として、予想される物質が多く設計されてしまい、研究開発者の想像を超える例外的物質はなかなか発見されないというジレンマがありました。例外的な物質を効率的に発見するためには、従来とは異なるAI技術の開発が必要となります。そこで、共同研究チームは、例外的な物質の探索に特化したAI開発を試みました。
2.研究手法と成果
共同研究チームは、機械学習をうまく組み合わせることで例外の度合いを数値化し、例外的な物質を積極的に発見するAIを開発し、「BLOX(BoundLess Objective-free eXploration)」と名付けました。BLOXは、特性が既に分かっている物質(既知物質)のデータベースを利用し、特性がまだ不明な物質(未知物質)のうち最も例外的と考えられる物質を提案します。まず、既知物質から機械学習を用いて特性を予測するモデルを構築し、その後、そのモデルを使って未知物質の特性を予測します。すると、図1のように、既知物質が示す特性分布(黒丸)と、未知物質に対する予測特性分布(三角)が得られ、未知物質の予測特性分布のうち最も「外れた」ものが例外的物質であると期待されます。
予測特性分布からの外れ度合いを数値化するために「Stein novelty[5]」という尺度を導入すると、例外的な物質(図1の赤三角)の候補が選択されます。さらに、この候補物質の実際の特性を実験やシミュレーションによって測定し、そのデータを既知物質のデータベースに追加します。以上のプロセスを繰り返すと、例外的な特性を示す物質データが次々と蓄積され、より例外的な物質の探索が促進されます。
図1 BLOXの枠組みにおける「例外」的物質の選択の模式図
黒丸は、既知物質のデータの分布を示しており、しばしば性質1と2の間にトレードオフが存在する。三角(赤三角を含む)は機械学習モデルによって予測され、まだ検証されていないデータの予測値を示している。例外的な物質は、既知物質のデータの分布から最も外れたものである。分布からの外れ具合をStein noveltyで定量化すると、赤三角が選択される。
次に、BLOXを用いて、創薬用の市販分子データベースであるZINCの中から、例外的な光吸収特性を持つ化合物を探索しました。低分子量の有機化合物(以下、分子と呼ぶ)のほとんどは250~450ナノメートル(nm、1nmは10億分の1メートル)程度の光を強く吸収し、これ以外の光を強く吸収する分子は例外的といえます。このような例外的な分子は、色素や有機太陽電池など光吸収特性を生かした機能性材料として有用です。BLOXによる探索では、分子がどの波長の光を効率良く吸収するかを、実験またはシミュレーションによって評価する必要があります。本研究では、量子力学に基づく分子シミュレーションである「密度汎関数理論(DFT)[6]」計算により光吸収特性を導出しました。
ZINCデータベースに含まれる10万個の分子から、BLOXとDFT計算を組み合わせて例外的な光吸収特性を持つ分子を2,000回探索し、例外的でない分子も含めて2,000個が得られました(図2)。すると、ランダムな探索により得られた分子の分布に比べて分布が大きく広がり、例外的な分子の候補を多数発見しました。さらに、DFT計算に基づいた光吸収特性が例外的な候補分子の中から8個を実際に準備し、実験的に光吸収特性を測定しました(図2)。その結果、光の吸収波長・強度ともに、DFT計算で予測された値とほぼ一致し、BLOXとDFT計算を組み合わせることで例外的な分子が効率的に発見できることが実証されました(図3)。
図2 BLOXに基づく例外的な光吸収特性を持つ分子の探索結果
青三角の点は、ランダムな探索によって見つかった分子の光吸収特性の分布を示しており、約250~450 nmの波長域で、ある程度吸収強度の強い分子が分布していることが分かる。BLOXによる探索(橙色の丸点)によって分子の分布が引き伸ばされ、例外的なつまり250 nmより短いあるいは450nmより長い吸収波長を持ちかつ吸収強度の強い分子が多数発見された。その中から赤矢印で示す8個の分子を実際に準備し、実験的に光吸収特性を測定した。
図3 BLOXが選んだ分子の実測された吸収スペクトル
密度汎関数理論(DFT)を用いた量子化学シミュレーションによって吸収波長が408.66 nm、強度が1.560と予測された分子(左上の構造式)の、ジクロロメタン(DCM)溶媒中で実測された吸収スペクトル(青線)。実測吸収スペクトルはDFT計算による予測(橙色点線)とほぼ一致しており、強度も概ね予測通りであった。図2の吸収強度1.5は、補正係数を乗じてモル吸光係数に換算すると0.4 x 105 mol-1 L cm-1程度である。
BLOXによって発見された分子は、例外的な光吸収特性を持ち、その性質ゆえに色素や有機太陽電池などの有用な機能性分子としてのポテンシャルを持ちます。注目すべき点は、これらの分子の多くはもともと薬開発の副産物として得られたもので、それらの光吸収特性は基本的に注目されてこなかったことです。これは、BLOXを用いれば、本来の用途を超えた有用な物質・材料を発見できることを示しています。
3.今後の期待
既存のAIやデータ駆動型科学では、多くの場合、人間が望みの材料特性をあらかじめ設定することで、新材料を開発してきました。しかし、今回開発・実証したBLOXは、それらとはアプローチが異なり予想外・想定外なものを積極的に発見する枠組みです。今後、このBLOXを自動合成システムなどと組み合わせれば、自動で例外物質が次々と発見され、研究者が全く想定していなかった性質を示す物質の発見が加速されると期待できます。
また、BLOXは化学や材料分野のみならず、幅広い科学分野における例外的事象の探索に活用されることも期待できます。
4.論文情報
<タイトル>
Pushing property limits in materials discovery via boundless objective-free exploration
<著者名>
Kei Terayama, Masato Sumita, Ryo Tamura, Daniel T. Payne, Mandeep K. Chahal, Shinsuke Ishihara, Koji Tsuda
<雑誌>
Chemical Science
<DOI>
10.1039/d0sc00982b
5.補足説明
[1] 機械学習
膨大なデータをコンピュータに入力し、その中にある既知の特徴を繰り返しコンピュータに学習させるか、もしくはデータそのものからコンピュータに規則性を発見させることで、未知のデータに対する解答を自動で得る手法。
[2] 量子力学に基づいた分子シミュレーション技術
量子力学方程式を計算機によって近似的に解くことで、分子の物性や反応性を予測する技術。
[3] 有機太陽電池
有機半導体を光電変換層として用いた太陽電池のこと。塗布プロセスによって大量生産できると同時に、安価かつ軽量で柔らかいことから、次世代の太陽電池として注目を集めている。
[4] 有機発光ダイオード
有機物質に電圧を加えた際に発光する性質(有機エレクトロルミネセンス)を利用した素子。スマートフォン、テレビなどに広く利用される。
[5] Stein novelty
データの分布からの外れ度合いを定量化するために本研究で提案した指標。近年、Stein discrepancyと呼ばれる二つのデータの分布間の「ずれ」を定量化する方法が機械学習分野で注目されている。本研究では、Stein discrepancyを用いて一様分布からの「ずれ」を測ることで、外れ度合いを定量化した。Stein noveltyを用いると、特性の数やデータ分布の形状や範囲にかかわらず、外れ度合いを計算できる。
[6] 密度汎関数理論(DFT)
分子や材料の電子の状態を得るための量子力学に基づいたシミュレーション手法の一つ。DFTはDensity Functional Theoryの略。
6.発表者
横浜市立大学大学院生命医科学研究科 准教授 寺山 慧(てらやま けい)
(研究当時 理化学研究所 革新知能統合研究センター 分子情報科学チーム 特別研究員)
理化学研究所 革新知能統合研究センター 分子情報科学チーム
特別研究員 隅田 真人(すみた まさと)
理化学研究所 革新知能統合研究センター 分子情報科学チーム
チームリーダー 津田 宏治(つだ こうじ)
(物質・材料研究機構 統合型材料開発・情報基盤部門 NIMS招聘研究員)
物質・材料研究機構 国際ナノアーキテクトニクス研究拠点
主任研究員 田村 亮(たむら りょう)