Science Tokyo AIシステム医科学分野 (清水研) では医療や生命科学と数理情報科学の融合領域の研究を行っており、その領域における最新の科学技術動向を日本語で概説しています。今回は2025年10月にNature Methods誌に発表された「PHLOWER leverages single-cell multimodal data to infer complex, multi-branching cell differentiation trajectories」(進化的情報を手がかりとした、RNA構造と3Dモチーフの統合予測) という論文をご紹介します。米国ハーバード大学のElena Rivas博士が率いるチームによる研究です。

忙しい方向けのSummary

細胞分化は、多細胞生物の発生や疾患の進行において中心的なプロセスです。このプロセスは、転写因子(TF)が遺伝子発現を調節することによって制御されています。単一細胞マルチモーダルシーケンシング技術は、個々の細胞の遺伝子発現とクロマチン状態を同時に測定できるため、この調節関係を理解する上で強力なリソースとなりますしかし、実験的に個々の細胞を経時的に追跡することは不可能なため、その分化経路(軌道)を計算によって推定する必要があります

既存の手法は、単純な軌道や分岐の少ないツリーの解析には用いられてきましたが、複雑な多分岐構造の推定や、マルチモーダルデータの統合的な解析には課題がありました

本研究で提示されたPHLOWER (decomposition of the Hodge Laplacian for inferring trajectories from flows of cell differentiation) は、これらの課題に対処する新手法です 。PHLOWERは、単一細胞データを「単体複体(simplicial complexes)」というグラフを一般化した高次の構造(ノード、エッジ、三角形など)として表現しますPHLOWERの核となる技術は、この単体複体上で「ホッジ・ラプラシアン (Hodge Laplacian)」の「調和成分 (harmonic component)」を利用する点にあります。具体的には、分化の終末状態にある細胞と前駆細胞を意図的に連結させることで、分化経路に対応する「穴(hole)」を単体複体の構造内に作り出します。ホッジ分解における調和成分は、これらの「穴」を捉えることができ、これにより細胞分化の「軌道エンベディング」を生成します。このエンベディング空間を解析することで、複雑な分化ツリーの構造を正確に再構築できます

PHLOWERは、PAGAやMonocle3といった11の既存手法と比較して、特に複雑な多分岐ツリーのトポロジー(構造)再現性において、ほぼ全ての評価指標で最も優れた性能を示しましたさらに、本手法はiPS細胞から作製した腎臓オルガノイドの分化過程(scRNA-seqとscATAC-seqのマルチオームデータ)の解析に応用されました

PHLOWERは、ポドサイト(足細胞)や尿細管細胞といった目的の腎臓細胞系列に加え、神経細胞や筋細胞といった望ましくない「オフターゲット細胞」への分化を含む、9つの複雑な分岐軌道を正確に同定しました

マルチモーダルデータを活用し、各分岐を制御する主要な転写因子(TF)を特定しました。特に、オフターゲットな神経細胞系列の制御因子として、PAX3, RFX4, ZIC2を突き止めましたこの予測を実証するため、空間トランスクリプトーム(Xenium)解析とsiRNAノックダウン実験が行われました 予測通り、これら3つのTF(PAX3, RFX4, ZIC2)を同時にノックダウンすると、オフターゲットの神経細胞や間質細胞が有意に減少し、一方で目的とするポドサイト前駆細胞や尿細管細胞の割合が増加し、その成熟も促進されることが確認されました

結論として、PHLOWERは複雑な細胞分化軌道を高精度に推定し、その制御因子を特定するための強力なツールであり、オルガノイドの分化プロトコル改善などにも貢献できることが示されました。

コードはこちらで公開されています。

Figureの読み解きポイント

  • Figure 1: PHLOWERの動作原理とワークフロー 新しく開発された軌道推定手法PHLOWERの全体的なワークフローが、マウス線維芽細胞(MEF)から神経細胞と筋細胞への分化を例に示されています 。入力されたマルチモーダル単一細胞データ(Input)からグラフ表現を作成し、擬似時間(pseudotime)を推定します(a) 。本手法の最大の特徴は、このグラフを「単体複体(Simplicial complex)」という高次構造に変換し、分化の終末細胞と前駆細胞を意図的に連結することで、各分化経路に対応する「穴(hole)」を作り出す点にあります(b) 。次に、ホッジ・ラプラシアン(HL)分解を行い、その「調和成分」を用いてこれらの「穴」を特異的に検出・分離する「エッジエンベディング」を生成します(c) 。最終的に、サンプリングされた軌道をこの空間に射影(Trajectory embeddings)し、分岐点(CT-map)を特定することで、複雑な分化ツリー構造を正確に出力します(d, Output)

  • Figure 2:PHLOWERのベンチマーク性能評価 PHLOWERと既存の11種類の主要な軌道推定手法との性能を、シミュレーションおよび実データセットで徹底的に比較した結果が示されています。10種類の複雑な多分岐(5〜18分岐)シミュレーションデータにおいて 、PHLOWERはツリー構造の類似性(HIM)、細胞の位置(Correlation)、分岐の割り当て(F1 branches)など、評価された全ての指標で一貫して最も優れた性能を達成しました(a) 。33種類のscRNA-seq実データセットを用いた評価においても、PHLOWERは総合精度(Accuracy)で最高スコアを記録しました(b) 。膵臓(c) や神経新生(d) といった複雑な実データ例では、Monocle3が分岐を見逃したり、PAGAが偽陽性の分岐(Wrong branches)を検出したりする(d) のに対し、PHLOWERのみが偽陽性なしに最も正確なツリー構造を再構築できることが視覚的に示され、その優位性が証明されています

  • Figure 3: 腎臓オルガノイドのマルチオーム解析 PHLOWERをiPS細胞から分化させた腎臓オルガノイドの単一細胞マルチオームデータ(scRNA+scATAC)に適用した結果が示されています。PHLOWERは、中胚葉からポドサイトや尿細管といった目的の腎臓系列、さらに間質細胞、神経・筋細胞といった望ましくない「オフターゲット」系列を含む、合計9分岐の複雑な分化ツリーの同定に成功しました(a) 。この分化ツリーは、実際の培養日数(b)や擬似時間(c)とよく相関しており 、生物学的に妥当な分化過程を捉えていることが示されました。既知のマーカー遺伝子の発現(d) によって各分岐が正確に同定されただけでなく、マルチオームデータを活用することで、各分岐を駆動する主要な転写因子(TF)が特定されました(e) 。特に、オフターゲットである神経細胞系列の制御因子としてPAX3、RFX4、ZIC2が同定され 、これが後の機能検証の重要な標的となっています。

  • Figure 4: 空間プロファイリングによる分化軌道の検証 Figure 3で同定された細胞集団と分化軌道を、Xenium空間トランスクリプトーム技術を用いて実際のオルガノイド組織切片上で検証した結果が示されています Figure 3で同定されたポドサイト、尿細管、神経細胞などの各集団が、オルガノイド組織内に空間的に局在していることが確認されました(a) 。空間データからPHLOWERで軌道を再構築しても、単一細胞データと一致する分化ツリーが得られました(b) 。また、Day 19とDay 25の比較から、前駆細胞が減少し成熟細胞が増加するというオルガノイドの成熟過程も定量的に捉えられています(c) 。さらに重要な点として、Figure 3で予測されたオフターゲットTF(PAX3, RFX4, ZIC2)が、対応する神経細胞集団の空間的位置で特異的に発現していることが確認され 、単一細胞解析の予測が空間的にも裏付けられました(d)。

  • Figure 5: siRNAノックダウンによる機能実証 PHLOWERの予測(「PAX3, RFX4, ZIC2」がオフターゲットな神経細胞を誘導する)の正しさを、siRNAノックダウン(KD)実験によって機能的に証明した決定的な結果が示されています。これら3つのTFを同時にKDしたオルガノイドでは、対照(Scrambled)と比較して、オフターゲットである神経・筋・間質細胞が有意に減少し、逆に目的のポドサイト前駆細胞と尿細管前駆細胞が有意に増加しました(a, b) 。この効果はタンパク質レベルでも確認され、オフターゲットマーカー(Vimentin)が有意に減少し(c, d) 、目的の細胞マーカーであるポドサイトのNephrin (NPHS1) と尿細管のE-cadherinが顕著に増加しました(e, f) 。これは、PHLOWERが同定した制御因子を操作することで、オルガノイドの分化効率を人為的に改善できたことを示す強力な証拠であり、本手法の予測能力と実用性を実証しています

手法の概説

グラフ表現と擬似時間の推定(前処理)

入力データはscRNA-seq(unimodal)またはscRNA-seq+scATAC-seq(multimodal)の単一細胞データを受け取ります初期埋め込みとして、マルチモーダルデータの場合はMOJITOO、scRNA-seqのみの場合はPCAを用い、細胞を低次元空間に配置します。

グラフ構築として、この低次元空間で、細胞間の関係性を拡散写像(Diffusion Maps) に基づくグラフ(グラフ・ラプラシアン)として表現します。グラフ上のランダムウォーク・プロセスを利用して、各細胞の分化の「時刻」にあたる擬似時間を計算します

単体複体(SC)の構築と「穴」の創出

通常の細胞分化ツリーはトポロジー的に「穴」のない構造です 。そこで、PHLOWERは意図的に「穴」を作り出します。まず、デローネ三角測量(Delaunay triangulation)を用いて、グラフから三角形(2-simplices)を形成し、単体複体(SC)の基盤を作ります

擬似時間に基づき、分化の起点(root, 低擬似時間)と終点(terminal, 高擬似時間)の細胞を特定します 。そして、終点の細胞から起点の細胞へと向かう「ダミーエッジ(artificial edges)」を人為的に追加します

このダミーエッジにより、各分化軌道(例:神経への経路、筋細胞への経路)が、それぞれ1つのトポロジカルな「穴(hole)」に対応する閉じた構造がSC内に創出されます