Science Tokyo AIシステム医科学分野 (清水研) では医療や生命科学と数理情報科学の融合領域の研究を行っており、その領域における最新の科学技術動向を日本語で概説しています。今回は2025年8月にオンライン先行公開、10月にCell誌に発表される「A generative deep learning approach to de novo antibiotic design」(生成的深層学習を用いた抗生物質の新規設計) という論文をご紹介します。Last authorのCollins博士はScience TokyoのGlobal Fellowをつとめてくださっており、清水がCollins先生との本学側の窓口を担当しています。Collins先生、論文おめでとうございます。
忙しい方向けのSummary
この論文は、薬剤耐性菌の危機に対応するため、深層学習を用いた新しい抗生物質をゼロから設計(デノボ設計)するAIプラットフォームの開発に関する研究です。研究チームは2つのアプローチを開発しました。
フラグメントベース設計:1000万種類以上の化学構造の断片(フラグメント)をAIでスクリーニングし、有望なフラグメントを基に分子全体を設計する。
デノボ(新規)設計:特定の開始点なしに、AIが完全に新しい分子を生成する。
これらの手法を用いてAIが生成した分子の中から24化合物を実際に合成し、実験的に検証したところ、7つの化合物が選択的な抗菌活性を示しました。特に、淋菌(N. gonorrhoeae)に有効なNG1と、黄色ブドウ球菌(S. aureus)に有効なDN1という2つのリード化合物は、多剤耐性菌に対しても高い効果を示し、既存の抗生物質とは異なる新しい作用機序を持つことが明らかになりました。さらに、マウスを用いた感染症モデル実験でも、これらの化合物が細菌量を減少させる効果があることを確認しました。
この研究は、AI(特に生成モデル)がこれまで探索されてこなかった広大な化学空間の中から、新しい構造と作用機序を持つ抗生物質候補を効率的に発見するための強力なツールとなることを示しています。
コードはこちらから入手可能です。
これまでの研究とその課題の概要
抗生物質が効かない薬剤耐性菌の感染症は世界的な公衆衛生の危機であり、新しい抗生物質の開発が急務となっています 。しかし、製薬企業による新規抗菌薬の開発は1980年代以降、停滞しています。そこで既存の薬とは構造も作用機序も全く異なる、構造的に新規な抗生物質が強く求められています 。
AIを用いて、コンピューター上で数百万の化合物ライブラリから抗菌活性を持つ候補を高速にスクリーニングする研究が進んできました。しかし、このアプローチは「既存の」化合物ライブラリを探索するものでした 。医薬品になりうる化合物の理論上の総数(およそ10の60乗個)に比べ、既存のライブラリはごく一部に過ぎず、発見できる化合物の構造的多様性には限界がありました。
そこで、AIが自ら新しい分子をゼロから設計する生成AIのアプローチに取り組みました。従来の創薬は特定のタンパク質に結合する分子を生成するというような研究が多いのですが、この研究では細菌の増殖を止めるかどうかという表現型を直接指標にしました。この標的を定めないアプローチは、未知の新しい作用機序を持つ薬を発見する可能性を秘めています。
Figureの読み解きポイント
- Figure 1: 淋菌に対するフラグメントベース設計とAIモデルの検証 本研究で採用されたAI創薬アプローチの最初のステップが示されています 。まず、4500万個以上の膨大な化学フラグメント(分子の断片)のライブラリが、既知の抗生物質とは異なる多様な化学空間をカバーしていることが可視化されています(B) 。次に、AI(グラフニューラルネットワーク)を用いて、淋菌に対する抗菌活性が期待できるフラグメントを予測し、毒性や化学的安定性などのフィルターを通して115万個まで絞り込むプロセスが描かれています(C, D) 。このアプローチの妥当性を証明するため、AIが有望と予測したフラグメント「F1」を含む既存の化合物(BRD1, BRD2)を試験したところ、実際に淋菌に対する抗菌活性が確認され、AIによるスクリーニングの有効性が実証されました(E, F, G)
- Figure 2: AIによる分子生成とリード化合物NG1の発見 Figure 1で有望とされたフラグメントF1を「種」として、AIが新しい抗菌薬候補を設計する過程が示されています。遺伝的アルゴリズム(F-CReM)(A)と変分オートエンコーダ(F-VAE)(C)という2種類の生成的AIモデルを用いて、F1を含む数百万の新規化合物を設計しました 。AIによる抗菌活性予測や合成しやすさのスコアに基づき、これらの化合物を絞り込み、最終的に合成する候補を選定しました(D) 。その結果、F-VAEが設計した化合物の一つであるNG1が、淋菌に対して0.5 μg/mLという非常に低い濃度で強力な抗菌活性を示し、かつヒト細胞への毒性が低い(選択性が高い)ことが実験的に証明されました(F, G, H)
- Figure 3: NG1の作用機序解明とin vivoでの有効性実証 リード化合物NG1が、医薬品として有望な特性を持つことを多角的に検証しています。NG1は、セフトリアキソンなど複数の薬剤に耐性を持つ淋菌株に対しても有効でした(A) 。作用機序の解析から、NG1は細菌の増殖を止めるだけでなく殺菌的に作用し(B, C)、細菌の外膜の構成要素であるリポオリゴ糖(LOS)の輸送を担うLptAというタンパク質を標的とすることが強く示唆されました(G, H) 。これは既存の抗生物質とは異なる新しい作用機序です 。最も重要な点として、マウスを用いた淋菌の膣内感染モデルにおいて、NG1を投与した群では細菌数が有意に減少し、in vivoでの有効性が証明されました(J, K) 。
- Figure 4: 黄色ブドウ球菌に対する設計と合成可能性の課題 淋菌で成功したフラグメントベースのアプローチを、グラム陽性菌である黄色ブドウ球菌に応用した結果が示されています。同様のAIスクリーニングにより、有望なフラグメントF2と、それを含む活性化合物EN1が同定されました(A, B, C, D) 。しかし、このF2の構造は化学合成による拡張が困難でした。そこで、合成を容易にするためにF2の構造を一部単純化したフラグメントF2’を設計し(E)、そこからAIで分子を生成したところ、予測通り合成しやすい化合物群が得られました(G, H) 。ところが、これらの合成しやすい化合物の抗菌活性は、元のF2を含む化合物に比べて大幅に低下してしまいました(I) 。これは、AI創薬における抗菌活性と合成のしやすさの間のトレードオフという現実的な課題を浮き彫りにしています 。
- Figure 5: フラグメント非依存的なデノボ設計と高い成功率 特定のフラグメントを開始点とせず、AIが完全にゼロから新しい分子を設計する「de novo設計」アプローチの成果が示されています(A) 。このアプローチでは、特にジャンクションツリー変分オートエンコーダ(JT-VAE)というモデルが、より医薬品らしい特性と高い合成可能性を持つ化合物を生成することに優れていることがわかりました(C, D) 。このJT-VAEが生成した化合物の中から、AIスコアや構造の新規性に基づいて22化合物を合成して評価したところ、そのうち6つ(DN1~DN6)が黄色ブドウ球菌に対して抗菌活性を示しました(F, G) 。これは27%以上という非常に高いヒット率であり、AIが広大な化学空間の中から自律的に有効な構造を発見できる能力を証明しています 。
- Figure 6: デノボ設計化合物の特性評価と作用機序の多様性 Figure 5で発見された6つの新規活性化合物(DN1~DN6)の詳細な特性が明らかにされています。中でもDN1は、メチシリン耐性黄色ブドウ球菌(MRSA)に対しても4 μg/mLという低いMICを示し、かつヒト細胞への毒性が低く、最も有望な化合物であることが示されました(A) 。これらの化合物はグラム陽性菌に広い活性スペクトラムを持つ一方で(B)、細菌の膜電位にそれぞれ異なる影響を与えることから、互いに異なる作用機序を持つ可能性が示唆されました(C) 。特にDN1は、クライオ電子顕微鏡による観察で、細菌の細胞膜を肥厚させるという特徴的な形態変化を引き起こすことが確認され、膜に作用することが強く示唆されました(G, H) 。
- Figure 7: リード化合物DN1の医薬品候補としての可能性 デノボ設計で見出されたDN1が、臨床応用も期待できる優れた医薬品候補であることが示されています。DN1は、MRSAに対して既存薬のバンコマイシンよりも速い殺菌効果を示し(A)、薬剤耐性が生じにくいという特徴も持っています。また、バンコマイシンなどが効かない多剤耐性株を含む臨床分離株に対しても、安定して低いMICを示しました(C) 。最も重要な成果として、MRSAによるマウスの皮膚感染モデルにおいて、DN1を塗布することで細菌数が10分の1に減少し、現在臨床で使われているフシジン酸と同等の治療効果が確認されました(E, F) 。これらの結果は、臨床応用に向けた可能性の高さを強く裏付けています
手法の概説
この研究では、深層学習を用いて新しい抗生物質を設計するために、複数の計算手法と実験手法が統合されています。中心となるのは、①AIモデルの構築、②フラグメントサーチ、そして③de novo(新規)設計の3つです。
AIモデルの構築とデータセット
研究の基盤となるのは、分子の化学構造からその抗菌活性や毒性を予測するAIモデルです。中核技術としてChempropというソフトウェアパッケージが用いられました 。これは、グラフニューラルネットワーク(GNN)の一種であるD-MPNNs(有向メッセージパッシングニューラルネットワーク)を実装したものです 。分子を原子と結合からなる「グラフ」として捉え、その構造情報を直接学習します。データセットとしては、2種類の細菌に対するモデルを個別に構築しました。
- 淋菌(N. gonorrhoeae)モデル: 38,765化合物の実験データで学習
- 黄色ブドウ球菌(S. aureus)モデル: 39,312化合物の実験データで学習
これらのデータは、各化合物が細菌の増殖を阻害したか・しなかったかという、二値化された実験結果です。この研究グループが過去に行った大規模な化合物スクリーニング実験のデータ (Nature 2024など) を利用しています。
安全な化合物を設計するため、ヒト細胞に対する毒性を予測するモデルも並行して使用されました。肝細胞(HepG2)、骨格筋細胞(HSKMCs)、肺線維芽細胞(IMR-90)の3種類の細胞株に対する毒性データで学習されています 。
AIは、入力された分子の構造情報(SMILES形式)を基に、抗菌活性を持つ確率、あるいは毒性を持つ確率を0から1のスコアとして出力します 。
ちなみに、これらの記載に関してはデータセットが独自という要素はありますがAIとしては新しい要素はほとんどないと思います。
フラグメントサーチ
巨大な化学空間から有望な「部品(フラグメント)」を見つけ出すための計算スクリーニングです。
フラグメントライブラリとしては3つの大規模データベース (GDB-11, J. Chem. Inf. Model. 2007; GDB-13, J. Am. Chem. Soc. 2009; Enamine REAL) から、合計45,858,026種類という膨大な数の化学フラグメントを集約しました 。これには、理論的に考えられる全ての小分子フラグメント(GDB-11, GDB-13)や、合成しやすいことがわかっているフラグメント(Enamine REAL)が含まれます。
まずこれら約4600万個の全フラグメントを、上記で構築した抗菌活性予測AIで評価し、スコア付けしました 。AIの予測スコアが高いフラグメントのみを選抜した後、毒性予測AIに入れてヒト細胞への毒性が低いと予測されたフラグメントのみを残しました。アッセイで偽陽性の原因となりやすい不安定な部分構造(PAINSやBrenk)を持つものを除外した後、既存の559種類の抗生物質と構造が似ていない(Tanimoto類似度が0.5未満)、新規性の高いフラグメントのみを最終候補としています。
デノボ(新規)設計
有望なフラグメントを基に、あるいは完全にゼロから、AIが新しい分子全体を生成するプロセスです。ここでは2種類の生成的AIモデルが活用されました。
遺伝的アルゴリズム(CReM): 生物の進化を模倣したアルゴリズムで、元の分子に原子の追加・置換・削除といった「変異」を繰り返し加えることで、新しい分子を生成します。フラグメントベース設計の際は、有望なフラグメント(例: F1)を含む分子から開始し、そのフラグメント構造を維持したまま変異を加え、AIスコアがより高くなるように分子を「進化」させていきます。de novo設計のときは、アンモニアやメタンのような非常に単純な分子から設計を開始します。
変分オートエンコーダ(VAE): 分子の構造を一旦、潜在空間と呼ばれる数値ベクトルに圧縮(エンコード)し、そのベクトルから元の分子構造を復元(デコード)する学習を行う深層学習モデルであり非常によく使われています。これを他のチームが改変したフラグメントベースVAE(F-VAE)は与えられたフラグメントを開始点として、そこから原子を一つずつ付け足していく形で分子全体を完成させるように特殊化されたモデルです。ジャンクションツリーVAE(JT-VAE)も同じく以前からあるもので、ここではde novo設計に用いられています。分子を原子レベルだけでなく、より大きな化学的モチーフ(官能基など)の繋がり(ジャンクションツリー)としても捉えることで、より複雑で妥当性の高い化学構造をゼロから生成することに長けています。
研究のLimitationとPerspective (私見)
本研究の課題は、見つかった化合物の化学合成の難しさです 。AIは理論上有効な分子を次々と設計できますが、それらを実際に研究室で合成できるとは限りません 。この研究でも、AIが生成した多くの候補の中から、実際に合成できたのはごく一部でした 。特にFigure 4で示されたように、抗菌活性と合成のしやすさがトレードオフの関係になることもあります。化合物の合成しやすさをより正確に予測するAIや、逆合成解析(完成物から原料への合成ルートを予測する技術)アルゴリズムのさらなる向上が必要と思われます。
それを踏まえたうえで、今後の研究ではAIに複数の目標を同時に最適化させる多目的最適化の導入が期待されます。これにより、「高い抗菌活性」「低い毒性」「合成のしやすさ」「代謝安定性」といった複数の重要項目を同時に満たす、より優れた医薬品候補を設計できるようになると考えられます。