Science Tokyo AIシステム医科学分野 (清水研) では医療や生命科学と数理情報科学の融合領域の研究を行っており、その領域における最新の科学技術動向を日本語で概説しています。今回は2025年8月にNature誌に発表された「One-shot design of functional protein binders with BindCraft」(BindCraft:機能性タンパク質を一発で設計する) という論文をご紹介します。スイス連邦工科大学ローザンヌ校(EPFL)のBruno E. Correia教授を中心とするスイスのチームと、アメリカ、オランダの研究機関や企業が連携した国際共同研究です。
忙しい方向けのSummary
この研究では、BindCraftという新しいオープンソースの計算パイプラインを開発しました。これは、特定の機能を持つタンパク質「バインダー」をゼロから設計するためのツールです。タンパク質は体内の様々な働きを担っており、特定のタンパク質に結合してその機能を調節する「バインダー」は、医薬品や診断薬、バイオテクノロジーの分野で非常に重要です。
BindCraftは、タンパク質の立体構造を高精度で予測するAIであるAlphaFold2の技術を応用しています。これにより、従来の手法よりもはるかに高い10%から100%という成功率で、標的タンパク質に強く結合する(ナノモルレベルの親和性を持つ)バインダーを設計できます。
この研究では、細胞表面の受容体、アレルギーの原因となるアレルゲン、さらにはCRISPR-Cas9のような遺伝子編集ツールなど、12種類の多様で難易度の高い標的に対してバインダーの設計を成功させています 。設計したバインダーが実際に機能することを示すため、花粉症患者のサンプルでアレルギー反応を引き起こすIgEの結合を抑制する、Cas9による遺伝子編集の活性を調節する、食中毒の原因となる毒素の働きを抑える、特定の細胞にだけ遺伝子を運ぶように、ウイルスの性質を改変する、などの実証も行っています。
BindCraftの登場により、これまで専門的な知識や大規模な実験設備が必要だったタンパク質バインダーの設計が、より多くの研究者にとって身近なものとなり、新しい治療法や技術の開発を加速させることが期待されます
コードはこちらにあります。
これまでの研究とその課題の概要
タンパク質間相互作用(PPIs)を制御するタンパク質バインダーは、治療やバイオテクノロジーにおいて非常に重要です。従来、その開発は動物免疫やライブラリースクリーニングといった、多大な時間と労力がかかり、結合部位の制御も難しい手法に頼っていました 。これを解決するため、Rosettaのような物理化学的計算に基づく初期の計算設計手法が登場しましたが、実験的な成功率が0.1%未満と極めて低く、膨大な数の候補を試す必要がありました (Nature 2023)。
近年、AlphaFold2(AF2)のような深層学習モデルがタンパク質構造予測に革命をもたらし、バインダー設計にも応用され始めました 。現在の最先端技術であるRFdiffusion (Nature 2023)は、AF2をフィルタリングに用いることで成功率を大幅に向上させました。しかし、この手法にも課題が残されています。具体的には、RFdiffusionは標的の構造を固定したままバインダーの骨格を生成し、その後に配列を設計するというステップを踏みます 。そのため、骨格を生成する段階と、実際に機能する相互作用を設計する段階の間にギャップがあり、最終的に「この設計で本当に結合するのか」という検証を、結局はAF2の予測に頼っているのが現状でした。
本研究は、このギャップを埋めるため、AF2を単なるフィルタリングツールとしてではなく設計プロセスそのものに直接活用することを目指しています。
Figureの読み解きポイント
- Figure 1: BindCraftによる新規バインダー設計の概要 新開発の計算パイプライン「BindCraft」のワークフローと、その有効性を12種類の多様な標的に対して検証した結果が示されています。まず、標的タンパク質の構造情報をもとに、AlphaFold2を用いてバインダーの骨格と配列を同時に生成し、続いてMPNNsolで配列を最適化、最後に再度AlphaFold2で検証して質の高い候補を絞り込むという一連の流れが描かれています(a) 。性能評価では、細胞表面受容体、アレルゲン、ヌクレアーゼといった挑戦的な12種類の標的に対し、10%から100%という高い実験的成功率で、ナノモルレベルの親和性を持つバインダーを設計できることが実証されています(b)
- Figure 2: 細胞表面受容体を標的としたバインダーの設計と機能実証 BindCraftで設計したバインダーが、細胞表面に存在する受容体に強力に結合し、さらには細胞の機能を調節できることを示した結果がまとめられています。PD-1、PD-L1、IFNAR2、CD45といった免疫関連の受容体に対し、設計したバインダーがナノモルレベルの高い親和性で結合することが、BLIやSPRという実験手法で確認されています(a-h) 。さらに、食中毒菌の毒素(CpE)が結合する膜タンパク質CLDN1を標的としたバインダーは、毒素の結合を競合的に阻害し(l) 、毒素による細胞死を効果的に抑制することが示されており(i, k) 、設計したバインダーが治療応用につながる機能を持つことが証明されています。
- Figure 3: アレルゲンを標的としたバインダーの設計とアレルギー反応の抑制 アレルギーの原因となるタンパク質(アレルゲン)の特定部位(エピトープ)に結合してアレルギー反応を抑制するバインダーの設計とその有効性を示しています。ダニアレルゲン(Der f 7, Der f 21)を標的としたバインダーの設計モデルは、X線結晶構造解析で得られた実際の立体構造と非常によく一致しており(b, d) 、BindCraftの設計精度が高いことを証明しています。特に注目すべきは、カバノキ花粉アレルゲン(Bet v 1)を標的としたバインダーであり、これが実際に花粉症患者の血清サンプル中で、アレルギー反応の主役であるIgEとアレルゲンの結合を最大50%阻害することに成功しました(i) 。これは、設計バインダーがアレルギー治療薬となりうる可能性を示す画期的な結果です。
- Figure 4: 難易度の高い核酸結合タンパク質の機能制御 従来は創薬標的として難しいとされてきた、DNAやRNAに結合するタンパク質の機能を、BindCraftで設計したバインダーによって制御できることを示しています。遺伝子編集ツールCRISPR-SpCas9のガイドRNA結合部位を標的としたバインダーは、意図した通りに結合し(a-c) 、ヒト細胞内での遺伝子編集活性を顕著に低下させました(d) 。また、これまで阻害剤が知られていなかったアルゴノートタンパク質(CbAgo)に対してもバインダー設計を行い、そのDNA切断活性を強力に阻害する世界初の分子を創出することに成功しています(e-g)
- Figure 5: 設計バインダーによるAAVベクターの標的指向化 BindCraftで設計したバインダーを遺伝子治療用のウイルスベクター(AAV)に組み込むことで、特定の細胞にだけ遺伝子を運ばせる「リターゲティング」に成功したことを示しています。AAVが本来持つ感染能力をなくし、代わりに特定の細胞表面タンパク質(PD-L1)を認識するバインダーをAAV表面に提示させるという戦略(a, b) により、改変AAVは標的タンパク質を持つ細胞にのみ、持たない細胞と比べて最大100倍という高い特異性で遺伝子を導入できました(c, f) 。この感染は標的タンパク質に対する抗体で阻害されることから、設計したバインダーが意図通りに機能していることが証明され(g) 、より安全で精密な遺伝子治療法の開発につながる可能性が示されました。
手法の概説
本論文では、新しいAIモデルをゼロから構築しているわけではなく、Google DeepMindによって事前に訓練されたAlphaFold2(AF2)のモデル(重み)を独創的な方法で再利用しています。
設計の基本プロセスと損失関数
BindCraftの設計プロセスは、AF2の構造予測ネットワークを逆方向(backpropagation)に利用して、目的の機能を持つバインダー配列を「幻覚(hallucinate)」させるというアイデアに基づいています 。まず、ユーザーは標的タンパク質の立体構造(PDBファイル)、設計したいバインダーのおおよその長さ、そして任意で結合させたい場所(ホットスポット)を指定します。設計は、ランダムなアミノ酸配列から始まります 。この配列と標的タンパク質をAF2に入力し、出力された予測構造が「どれだけ理想的なバインダーから離れているか」を損失関数として数値化します 。この損失関数は、以下の複数の数理的指標を重み付けして組み合わせたものです 。AF2信頼度スコア (バインダー自体の構造信頼度(pLDDT)と、標的との境界面の信頼度(i_pTM)) 、予測アラインメントエラー (PAE, バインダー内部、およびバインダーと標的間の構造的な配置の正確さ)、残基間コンタクト (バインダーがコンパクトな構造を形成し、かつ標的と適切に接触しているか )、 ヘリシティ損失 (αヘリックス構造を意図的に増減させるための項。これによりβシート構造を持つバインダーの設計も可能になる)。計算された損失(エラー)を勾配としてネットワークを逆伝播させ、損失が最小になるように入力配列を少しずつ最適化していきます 。この際、特定のモデルに過剰適合するのを防ぐため、AF2 multimerの5種類の学習済みモデルをランダムに切り替えながら計算が行われます。
配列最適化
最適なアミノ酸配列を効率的に見つけ出すため、BindCraftは4つの段階を経て配列を徐々に現実的なものに近づけていきます 。まずは連続空間での探索 (Logits)で、 各アミノ酸の確率的な表現(ロジット)を用いて、広大な配列空間を自由に探索します。次第に確率の高いアミノ酸が選ばれやすいように制約をかけ(温度アニーリング)、現実的な配列候補へと絞り込んでいきます。最終的に特定のアミノ酸配列(one-hot)に固定し、ランダムな変異を導入して最も良い配列を探す微調整を行います。
安定化と最終フィルタリング
FF2によって生成された配列は結合には優れていても、タンパク質としての安定性や溶解性が低いことがあります。そこで、バイオインフォマティクスツールを用いた後処理とフィルタリングが行われています。まず、結合に関わる境界面のアミノ酸は固定したまま、それ以外のコア部分や表面部分の配列を、タンパク質の安定性と溶解性が向上するようにニューラルネットワーク(MPNNsol, Nature 2024)で再設計します。そして、再設計されたバインダー候補を、複合体予測のバイアスが少ないAF2 monomerモデルで再度評価します。さらに、物理化学的なエネルギー計算に基づいたRosettaというソフトウェアも用いて、構造の物理的な妥当性(形状相補性や水素結合など)を厳しくチェックします 。最終的に、i_pTM > 0.5、形状相補性 > 0.60といった複数の閾値をクリアした質の高い設計候補のみが選出されます。
研究のLimitationとPerspective (私見)
本研究の課題は、計算上の予測と実際の生物学的性能・治療応用との間のギャップです。BindCraftは強力ですが、計算コストが非常に高く、候補のランク付けに使う指標(i_pTM)は結合の有無を予測するものの、その強さとは相関しません。また、AlphaFold2はアミノ酸の微細な変異に鈍感な場合があり、これが結合を左右することもあります。さらに、治療薬として応用するには、設計したタンパク質の体内での免疫原性や送達効率といった、計算だけでは解決が難しい臨床的なハードルが存在します。
それを踏まえ、今後の研究ではこれらの課題を克服することが期待されます。医療・バイオロジー分野での展望は非常に大きく、例えば、遺伝子治療の分野では、AAVウイルスの表面に特定の細胞(がん細胞など)だけを認識するバインダーを組み込むことで、副作用の少ない高精度な治療用ベクターの開発が飛躍的に簡略化されます。免疫学の分野では、複数のアレルギー原因部位を同時にブロックする新しいアレルギー治療薬や、PD-1などを標的とした次世代のがん免疫療法薬の創出につながる可能性があります。さらに、CRISPR-Cas9の働きを精密に調節する分子ツールを設計することで、遺伝子編集技術の安全性を高めるといった応用も考えられ、基礎生物学の複雑な生命現象を解明するための貴重な研究ツールとしても貢献していくでしょう。