【論文解説】RFdiffusionによる原子精度の抗体De novo設計 – AIシステム医科学@東京科学大学 (Science Tokyo, Shimizu Lab)

Science Tokyo AIシステム医科学分野 (清水研) では医療や生命科学と数理情報科学の融合領域の研究を行っており、その領域における最新の科学技術動向を日本語で概説しています。今回は2025年11月にNature誌に発表された「Atomically accurate de novo design of antibodies with RFdiffusion」(RFdiffusionによる原子精度の抗体De novo設計) という論文をご紹介します。米国ワシントン大学のDavid Baker博士が率いる米国・カナダ・韓国の国際チームによる研究です。

忙しい方向けのSummary

抗体医薬は現代医療において中心的な役割を果たしていますが、既存の探索手法（動物への免疫化やランダムライブラリのスクリーニング）では、治療上重要な特定のエピトープ（結合部位）を狙い撃ちすることや、結合モードを制御することは困難でした。これまで、特定の標的エピトープに対して、抗体をゼロから（de novo）計算機のみで設計する手法は存在しませんでした。

本研究で提示された手法は、タンパク質骨格生成AIであるRFdiffusion (Nature 2023) を抗体設計用に特化（ファインチューニング）させたものです。本手法の核となる技術は、標的抗原の構造と、狙いたいエピトープ上の「ホットスポット残基」を入力条件として与える点にあります。RFdiffusionはノイズ除去プロセスを通じて、指定されたエピトープに結合する抗体のバックボーン構造（CDRループ）と、抗原に対する最適な結合ポーズ（ドッキング）を同時に生成します。配列設計にはProteinMPNNを用い、スクリーニングには抗体-抗原複合体予測用に調整されたRoseTTAFoldを採用することで、実験成功率を高めています。

本手法を用いて、インフルエンザ赤血球凝集素（HA）、C. difficile 毒素B（TcdB）、RSV、SARS-CoV-2などを標的としたVHH（ナノボディ）の設計に成功しました。特筆すべきは、インフルエンザHAに対するVHHのCryo-EM（クライオ電子顕微鏡）解析です。設計モデルと実構造の主鎖RMSDは1.45 Å、CDR3ループに関しては0.84 Åと、原子レベルでの驚異的な一致を示しました。初期デザインの結合力は中程度（マイクロモル〜数百ナノモル）でしたが、OrthoRep（酵母を用いたin vivo連続進化システム,ACS Synth. Biol. 2024）を適用することで、設計された結合モード（原子レベルの相互作用様式）を維持したまま、親和性を大幅に（ナノモルオーダーまで）向上できることが実証されました。

さらに、本手法はより複雑なscFv（一本鎖抗体）の設計にも拡張されました。重鎖・軽鎖の構造的適合性を考慮したコンビナトリアル・アセンブリ戦略をとることで、TcdBや、がん免疫療法の標的として重要なPHOX2B-MHC複合体（ペプチド-MHC）に対する特異的なscFvを取得しました。TcdBに対するscFvのCryo-EM解析では、6つのCDRループすべてにおいて原子精度（RMSD 0.9 Å）で設計モデルと一致することが確認されました。

結論として、本手法は特定の治療標的エピトープに対して、原子レベルの精度で抗体をde novo設計できる初めてのフレームワークであり、従来の免疫法では困難だった創薬ターゲットへのアプローチを可能にします。

コードはこちらで公開されています。

Figureの読み解きポイント

Figure 1: RFdiffusionによる抗体設計の概要 抗体のde novo設計を実現するために開発されたRFdiffusionのトレーニング方法と設計パイプラインの全体像を示しています。aでは、ガウスノイズから始まり、学習済みモデルがノイズを除去しながら新しい抗体構造（ここではscFv）を生成するプロセスが描かれています。bでは、抗体のフレームワーク（FR）構造を距離・角度行列（テンプレート）として入力し、可変であるCDRループのみを生成対象とする工夫が示されています。cは、フレームワークの不変テンプレートを使用することで、抗原に対する抗体の相対的な配置（ドッキング）を多様にサンプリング可能にしている点を示しています。dでは、抗原上の「ホットスポット残基」を指定することで、エピトープ特異的な結合を誘導できることが示されています。eは設計パイプラインの全体フローであり、RFdiffusionによる骨格生成、ProteinMPNNによるCDR配列設計、そしてファインチューニングされたRoseTTAFold2による構造フィルタリングという一連の流れがまとめられています。
Figure 2: 設計されたVHHの生化学的特性評価 RFdiffusionを用いて設計されたVHH（ナノボディ）が、実際に標的タンパク質に対して結合能を持つことを実験的に検証した結果が示されています。a, bでは、RSV（Site III）およびインフルエンザHAに対して設計された数千種類のVHHを酵母ディスプレイでスクリーニングし、トップヒットの可溶性タンパク質をSPR（表面プラズモン共鳴）解析した結果、それぞれ1.4 μMおよび78 nMという解離定数（K_d）で結合することが確認されました。c, dはエピトープ特異性の検証結果であり、SARS-CoV-2 RBDおよびTcdBに対するVHHが、設計されたエピトープに結合しているかを確認するため、既知の競合バインダー（AHB2やFZD48）を用いた競合実験が行われています。これにより、設計VHHが意図したエピトープを特異的に認識していることが証明されました。
Figure 3: インフルエンザHAおよびTcdB結合VHHのCryo-EM構造解析 設計されたVHHの結合様式が、計算モデルと原子レベルで一致することを証明するクライオ電子顕微鏡（Cryo-EM）解析の結果です。a-hはインフルエンザHAと設計VHH（VHH_flu_01）の複合体構造を示しており、3.0 Åの分解能で決定された構造は、設計モデルと全体RMSD 1.45 Å、CDR3ループに関しては0.84 Åという極めて高い一致を示しました。eでは、側鎖の向き（Rotamer）までもが正確に予測されていたことが確認できます。i-nはTcdBに対するVHHの解析結果であり、初期デザイン（H2）とその親和性成熟体（H2_ortho）の両方が解析されました。OrthoRepによる進化実験後も結合ポーズ（ドッキング角度）は維持されており、RFdiffusionによる初期設計の構造的堅牢性が実証されています。
Figure 4: 6つのCDRを持つscFvのコンビナトリアル設計と評価 VHHよりも複雑な構造を持つscFv（一本鎖抗体）の設計戦略と、その検証結果が示されています。aはTcdBのFrizzledエピトープを標的とするscFvのアライメントです。この研究では、構造的に類似した複数のデザインから重鎖と軽鎖を組み合わせてライブラリ化する「コンビナトリアル・アセンブリ」戦略が採用されました。d-iでは、この戦略で取得されたscFv5およびscFv6がTcdBに対してナノモルオーダー（それぞれ460 nM, 72 nM）の親和性を示し、IgG化しても結合能を維持することが示されています。jの競合実験により、これらのscFvが標的受容体（Frizzled-7）の結合部位を特異的に認識していることが確認されました。k-nはがん抗原であるPHOX2B-MHC複合体に対するscFv設計の結果であり、特定のペプチド残基（R6）を認識し、点変異体には結合しない高い特異性が実証されています。
Figure 5: TcdB結合scFvのCryo-EM構造解析 De novo設計されたscFvが、予測通りの構造で標的に結合していることを示す構造解析の結果です。a-gはTcdBとscFv6の複合体構造（3.6 Å分解能）を示しており、全体構造のRMSDは0.9 Åと非常に低く、設計モデルと実験構造がほぼ完全に一致しました。特にfでは、6つのCDRループすべてにおいて高い構造一致（CDRL1=0.2 Å, CDRH2=0.3 Åなど）が見られ、計算機による複数鎖抗体の精密設計が可能であることが証明されました。h-jは別の結合モードを持つscFv5の解析結果であり、低分解能（6.1 Å）ながらも、設計モデル通りのドッキングポーズで結合していることが確認されています。

手法の概説

抗体設計AIモデルの構築 (RFdiffusion for Antibody Design)

本研究の核となるのは、タンパク質骨格生成モデルRFdiffusionを抗体設計用にファインチューニングしたものです。学習プロセスでは、タンパク質構造に対し、ガウスノイズ（並進）とSO(3)上のブラウン運動（回転）を加えて崩壊させ、それを逆再生してノイズ除去することで構造生成を学習させています。損失関数は、真の構造と予測されたノイズ除去構造）との間の平均二乗誤差（MSE）を最小化するように設定されています。主にPDB（Protein Data Bank）由来の「抗体-抗原複合体」構造を用いてファインチューニングされました。

抗体のフレームワーク（骨格）部分は、配列および構造情報（残基間の距離と二面角の2Dマトリックス）としてモデルに入力されます。これにより、フレームワーク構造を維持しつつ、CDRループと抗原へのドッキング配置のみを生成させることが可能になります。抗原上の狙ったエピトープに結合させるため、標的残基（ホットスポット）をワンホットエンコーディング形式でモデルに入力し、生成をガイドしています。

配列設計

RFdiffusionによって生成された抗体バックボーン構造に基づき、ProteinMPNNを用いてCDRループのアミノ酸配列を設計しています。フレームワーク部分の配列は入力として固定されています。

In silico スクリーニングと評価

生成された数多くのデザインの中から、実験成功率の高いものを選別するために、構造予測モデルを用いたフィルタリングが行われました。設計された配列が、実際に意図した構造（抗原との複合体）をとるかを検証するためRoseTTAFold2 を使っています。抗体-抗原複合体構造でファインチューニングされており、入力として「抗原の構造」と「エピトープ位置情報」を与えることで、予測精度を向上させています。

研究のLimitationとPerspective (私見)

本研究の課題は、実験的な成功率の低さと、それに伴うスクリーニングの負担です。AIは原子レベルで正確な抗体骨格を設計できますが、実際に標的へ結合するデザインは数千個のうちごくわずか（0〜2%）に留まりました。特に、SARS-CoV-2のRBDのように構造的な柔軟性が高い標的では、設計とは異なる結合モードをとってしまう失敗例も確認されており、動的な標的への対応には課題が残ります。また、設計されたCDR配列は天然のヒト抗体に比べて「ヒトらしさ」が低いため、将来的な医療応用においては免疫原性が懸念され、配列設計アルゴリズムの改良も必要とされています。加えて、現在のモデルはタンパク質以外の原子（糖鎖など）を含むエピトープを認識する設計には対応していません。

それを踏まえたうえで、今後の研究ではより高精度な予測モデルの統合と、生成モデル自体のアーキテクチャ進化が期待されます。事後解析で示されたように、AlphaFold3のような最新の構造予測AIをフィルタリングに導入することで、実験成功率は大幅に向上すると予測されます。さらに、現在の拡散モデルからFlow Matchingなどの次世代生成モデルへ移行することで、より多様で設計可能性の高いバックボーン生成が可能になるでしょう。これらに加え、ヒト抗体配列の学習強化や、全原子モデルへの拡張が進むことで、「高親和性」「低免疫原性」を兼ね備え、かつ糖鎖などの複雑な抗原も標的可能な、実用的な抗体医薬のin silico創出が加速すると考えられます。