Science Tokyo AIシステム医科学分野 (清水研) では医療や生命科学と数理情報科学の融合領域の研究を行っており、その領域における最新の科学技術動向を日本語で概説しています。今回は2025年8月にNature Microbiology誌に発表された「Deep learning reveals antibiotics in the archaeal proteome」(深層学習が明らかにする、古細菌プロテオーム内の抗生物質) という論文をご紹介します。ペンシルベニア大学Cesar de la Fuente-Nunez博士が率いるチームによる論文です。

忙しい方向けのSummary

この研究は、AIを用いて、これまで抗生物質探索の対象としてほとんど注目されてこなかった古細菌(Archaea)から、新しい抗生物質を発見しようとするものです抗生物質が効かない薬剤耐性菌は世界的な脅威となっており、新しい抗生物質の開発が急務です 。研究チームは、独自に開発した深層学習モデル「APEX 1.1」を使い、233種の古細菌が持つ全タンパク質(プロテオーム)の中から、抗菌作用を持つ可能性のある短いペプチドを探索しましたその結果、12,623個もの候補物質を発見し、これらを「アーケアシン(archaeasins)」と名付けました 。その中から80種類を実際に合成して効果を試したところ、93%が薬剤耐性菌を含む複数の病原菌に対して抗菌活性を示しましたさらに、マウスを用いた動物実験では、特に「アーケアシン-73」という物質が、既存の抗生物質であるポリミキシンBに匹敵する高い治療効果を示しました 。アーケアシンの多くは、細胞質膜を破壊することで効果を発揮し、ヒトの細胞に対する毒性は低いものが多く見つかりました

この研究は、古細菌が次世代の抗生物質の宝庫である可能性を初めて大規模に示し、AI技術が新薬発見を加速させる強力なツールになることを証明しました

コードはこちらにあります。

これまでの研究とその課題の概要

この研究の背景には、世界中でますます深刻になっている薬剤耐性菌(AMR)の脅威があります 。既存の抗生物質が効かなくなり、治療困難な感染症が増えているため、全く新しい抗生物質を見つけ出すことが社会全体の急務となっていますこれまでの抗生物質探索では、生物の主要な3つのグループ(細菌、古細菌、真核生物)のうち、「古細菌(Archaea)」はほとんど注目されてきませんでした 。古細菌は、高温や高塩分濃度といった極限環境に生息し、細菌とは異なる独自の細胞膜や代謝経路を持っています 。この独自の生物学的特徴は、これまで知られていなかった新しい構造や作用を持つ抗生物質を生み出す宝庫である可能性がありますそこで本研究の課題は、この未開拓な「古細菌」の世界を深層学習で体系的に探索し、薬剤耐性菌との戦いに打ち勝つための、全く新しい抗生物質候補を発見することです

Figureの読み解きポイント

  • Figure 1: 深層学習による古細菌からの抗生物質候補の探索  新しく開発された深層学習モデル「APEX 1.1」を用いて、これまで未開拓であった古細菌のプロテオームから、新しい抗菌ペプチド候補(アーケアシン)を探索した結果が示されています。系統樹を用いた網羅的な探索(a)により、233種の古細菌から12,623個もの有望な候補が発見されました。発見されたアーケアシンは、配列の類似性マップ(b)やアミノ酸組成(c)、物理化学的性質(d, e)において、既知の抗菌ペプチドとは異なる独自のグループを形成しており 、全く新しいタイプの抗生物質である可能性が示唆されています。
  • Figure 2: アーケアシンの抗菌活性と構造 コンピュータ上で予測されたアーケアシンの実際の効果を、合成したペプチドを用いて実験的に検証した結果が示されています。80種類のアーケアシンのうち93%が、薬剤耐性菌を含む広範な病原菌に対して抗菌活性を示し(aのヒートマップ)、その高いヒット率と有効性が証明されました 。また、アーケアシンは水中(b)では特定の構造をとりませんが、細菌の細胞膜を模した環境下(c, d)では立体構造を形成することから 、膜と相互作用する際に構造を変化させて機能することが示唆されています。
  • Figure 3: アーケアシン同士の相乗効果 複数のアーケアシンを組み合わせることで治療効果が高まるか(相乗効果)を検証した結果が示されています。系統樹上で近縁な古細菌に由来するペプチドのペア79組を試験したところ、多くの組み合わせで単独使用時よりも効果が高まる相乗効果(FICI値 ≤ 0.5)または相加効果が確認されました 。この結果は、アーケアシンを組み合わせる「併用療法」によって、より効果的に薬剤耐性菌を治療できる新たな戦略の可能性を示しています
  • Figure 4: アーケアシンの作用メカニズムと安全性 アーケアシンがどのように細菌を殺すのかという作用メカニズムと、ヒト細胞に対する安全性を解明した結果が示されています。アーケアシンは、細菌の外側の膜(外膜)を透過する力は限定的である(a)一方 、主に内側の細胞質膜に直接作用し、その電位を破壊(脱分極)させることで殺菌効果を発揮することが明らかになりました(b) 。一方で、ヒトの赤血球や腎臓細胞に対する毒性は、抗菌効果を示す濃度域では非常に低いものが多く(d) 、治療薬として有望な安全性プロファイルを持つことが証明されています。
  • Figure 5: 動物モデルにおけるアーケアシンの治療効果 候補物質の中から特に有望なアーケアシンを選び出し、実際の感染症に対する治療効果をマウスモデルで検証した結果が示されています。薬剤耐性菌(アシネトバクター・バウマニ)による皮膚感染モデルにおいて、特にアーケアシン-73は、既存の強力な抗生物質であるポリミキシンBと同等の高い治療効果を示し、細菌数を劇的に減少させました(a, b)。また、体の深部での感染モデルにおいても菌の増殖を抑える効果が確認され(c, d) 、アーケアシンが生体内でも有効な抗生物質として機能することが実証されました。

手法の概説

AIモデル (APEX 1.1) の構築と学習データ

この研究の核となるのは、特定の細菌株に対する抗菌活性(MIC値)を予測するために改良された深層学習モデル「APEX 1.1」です。これまで自前で集めてきた機関データとして1,642種類のペプチドを11の病原菌株に対して試験した、計15,718件のMIC値データを使用しています。それに加え、DBAASPやAPD3などの公開データベースから19,564件の既知抗菌ペプチド(AMPs)9,857件の非抗菌ペプチドを追加しました抗菌活性が見られなかった(MIC値が測定上限を超えた)データには、512 µmol/Lという仮想のMIC値を割り当て、モデルが非活性ペプチドの特徴も学習できるように工夫されています

ベースになっているのは筆者らの先行モデルAPEX (Nature Biomed. Eng. 2024 )で、タンパク質のペプチド配列のみからGRU + Attention後に効果があるか (分類) とMIC (回帰) をそれぞれ行うヘッドを訓練し、絶滅した生物のペプチドで検証したというものでした。それとの差分は、自前のデータが増えていること、効かないのも込みで全部回帰にしていること、そして性能の良い上位8つのモデルの予測値を平均して最終結果とするアンサンブル学習の手法が採用されていることです

バイオインフォマティクスと数理解析

AIによる予測と並行して、ペプチドの特性を多角的に評価するために様々な計算手法が用いられました。公共データベースUniProtから233種の古細菌のタンパク質配列(18,677件)を取得しましたこれらのタンパク質を8〜50アミノ酸の長さにスライディングウィンドウで分解し、AIでスクリーニングするための約1億9300万個のペプチド(Encrypted Peptides: EPs)からなる巨大なデータベースを構築しました

発見されたアーケアシンと既知の抗菌ペプチドが配列的にどれだけ似ているかを比較するため、Smith-Watermanアルゴリズムで全ペアの類似度スコアを計算しましたこの複雑な類似度情報を、UMAPという次元削減技術を用いて2次元のマップに変換し、配列の多様性や新規性を視覚的に評価できるようにしました

生物種間の進化的関係を評価するため、NCBIのデータベースを用いて古細菌の系統樹を作成し、iTOLというツールで可視化しています。2種間の距離は、系統樹上の最短経路として定義されました

候補ペプチド(アーケアシン)の選抜

AIが予測した約1億9300万個のペプチドの中から、実験で検証する有望な候補を絞り込むために、以下の計算基準が設定されました。

まず、11菌株に対する予測MIC値の平均値が80 µmol/L以下であること。そして既知の抗菌ペプチドとの配列類似度が70%未満であること (新規性) 選抜する候補ペプチド同士の配列類似度も70%未満に保ち、多様な種類を確保すること (多様性)化学合成を妨げる可能性のあるシステインを複数含むペプチドや、凝集しやすい配列は除外されています

研究のLimitationとPerspective (私見)

本研究の課題は、AIモデルがペプチドのアミノ酸配列のみに基づいて活性を予測しており、その効果に重要となる立体構造の情報を考慮できていない点です。これにより予測精度に限界が生じる可能性があります。また、探索対象が信頼性の高い「レビュー済み」タンパク質データに限定されていたため、膨大な「未レビュー」データに眠る未知の候補物質が見過ごされています 。さらに、動物実験ではペプチドの効果が時間とともに低下しており、これは生体内での安定性の低さ(分解されやすさ)を示唆する大きな課題です

それを踏まえたうえで、今後の研究ではAIモデルに立体構造予測を組み込むことで、より精度の高い候補物質の発見が期待されます。また、ペプチドの安定性を向上させるために、D-アミノ酸の導入や環状化といった化学修飾を施すことで、より長く体内で効果を発揮する治療薬へと最適化していく必要があります 。最終的には、アーケアシン-73のような強力な候補を、実際の感染症治療に用いるための臨床開発へと進めることが最も重要な展望となります