Science Tokyo AIシステム医科学分野 (清水研) では医療や生命科学と数理情報科学の融合領域の研究を行っており、その領域における最新の科学技術動向を日本語で概説しています。今回は2025年9月にNature誌に発表された「Supervised learning in DNA neural networks」(DNAニューラルネットワークにおける教師あり学習) という論文をご紹介します。カリフォルニア工科大学(Caltech)のLulu Qian博士が率いるチームによる論文です。

忙しい方向けのSummary

この研究は、DNA分子そのものをプログラムし、試験管内で自律的に「学習」するニューラルネットワークを世界で初めて実現したという画期的な内容です。

従来の分子コンピューティングでは、計算に必要なパラメータ(重み)をあらかじめコンピュータで計算し、その設計通りにDNA分子を混ぜていました。これは、いわば「ハードウェア」をその都度作っているようなものです。

それに対し本研究では、DNAニューラルネットワークが、分子でできた訓練データ(手書き数字のパターンなど)を「見て」、どのパターンがどのクラスに属するかを自ら学習します。学習した内容は、特定のDNA分子の濃度という形で「記憶」として蓄えられます。そして、その記憶を使って、未知のテストデータを正しく分類することができます。

実験では、100個の点(100ビット)で表現された手書き数字のパターンを分類するネットワークを構築し、その学習能力と分類性能を実証しました。この技術は、体内で病気の兆候を学習して応答するスマートな薬剤や、過去の経験に基づいて性質が変化する自己修復材料など、「賢い」分子システムの実現に向けた大きな一歩と言えます。

これまでの研究とその課題の概要

これまでの研究では、脳の情報処理にヒントを得て、DNAやタンパク質といった生体分子を部品として使い、計算を行う分子回路が作られてきました。これらは分子レベルでパターンを認識するなど、ニューラルネットワークのような計算を実行できることが示されていました。しかし、そこには決定的な課題がありました。それは、計算に必要なパラメータの学習を、分子自身が行うのではなく、人間がコンピュータ(in silico)で行っていた点です。つまり、これまでの分子回路は、あらかじめ設計された計算を実行するだけの「ハードワイヤードプロセッサ」のようなもので、環境から自律的に学ぶ能力はありませんでした。そのため、実験で示されたのは、十数個程度の信号を扱う単純な適応行動に限られており、複雑な情報処理タスクを自ら学ぶシステムの実現には至っていませんでした

Figureの読み解きポイント

  • Figure 1: DNAニューラルネットワークの概念と設計 本研究で実現したDNAニューラルネットワークの基本概念と、それを分子レベルで実装するための設計が示されています 。訓練パターンとクラスラベルを入力すると、分子の化学反応によってネットワーク内の重み(記憶)が自律的に形成され、その記憶を使って未知のテストパターンを分類する一連のプロセスが描かれています。この計算を、DNA鎖置換反応(特にシーソーモチーフ)を用いて物理的に実装するための、具体的な分子回路設計が示されています
  • Figure 2: 主要な分子モチーフの設計と性能評価 学習と計算を担う、新しく設計された2つの重要なDNA分子モチーフの性能を実験的に検証した結果が示されています。1つ目は、学習した記憶に応じて計算のスイッチを入れる「活性化可能な増幅ゲート」です。狙い通りの相手とだけ反応する高い特異性と、信号を増幅する能力が実証されました 。2つ目は、入力パターンから記憶を生成する「活性化可能な変換ゲート」です。学習が不可逆的に進むように設計されており、これも高い特異性を持つことが確認されました
  • Figure 3: 活性化可能なメモリを用いたパターン分類性能の検証 DNAニューラルネットワークの
  • 分類機能(プロセッサ)が正しく動作するかを、理想的な記憶(活性化因子)を外部から与えることで検証しています。MNIST手書き数字データベースの「0と1」「3と4」「6と7」といったパターンを分類するタスクを設定し、様々なテストパターンを入力しました 。蛍光強度を測定した結果、全てのテストパターンに対して期待通りに正しく分類できていることが示されました
  • Figure 4: DNA分子によるin vitroでの自律学習の証明 実際に試験管内でDNA分子自身に学習を行わせ、その結果として形成された記憶(学習済み重み)を可視化・評価しています。100ビットのメモリに手書き数字の「0」と「1」を学習させたところ、メモリ上に数字の形が見事に浮かび上がり、分子レベルでパターン情報が正しく記憶されたことが示されました。また、異なるクラスの情報はそれぞれ対応するメモリに正しく書き込まれ、後から来た情報によって以前の記憶が破壊されずに統合されることも確認されており 、システムの学習能力の正確性と堅牢性が実証されています
  • Figure 5: 学習システムの複雑性(スケーラビリティ)評価 学習と分類を統合した完全なシステムにおいて、扱うパターンの複雑さ(ビット数)を増大させた場合の性能変化を評価しています。パターンのビット数を4から100まで増やして実験したところ、複雑さが増すにつれて分類性能が低下する傾向が確認されました 。この性能低下の主な原因は、活性化したビットの数ではなく、回路内で「使用されずに抑制されたままの部品」の割合が増えることによるノイズの増大であることが突き止められました
  • Figure 6: 学習済み重みを用いた100ビットパターン分類の最終実証 この研究の集大成として、自律的に学習した100ビットの記憶を用いて、未知のパターンを分類する一連のプロセスを実証しています。この学習システムは、従来の学習機能を持たないシステムに比べて約7倍も多くの分子部品から構成される非常に複雑なシステムであることが示されています。実際に3種類のパターン(「0と1」など)を学習させた後、テストパターンを分類させたところ、実験結果はシミュレーションと非常によく一致し、学習した記憶に基づいて正しく分類できることが証明されました

手法の概説

DNAコンピューターの原理とアーキテクチャ

このDNAコンピュータの基本原理は、DNA分子の濃度を「情報」DNA鎖置換反応という分子同士の結合・解離を「計算」として利用する点にあります。本研究では、従来のDNA回路アーキテクチャである「シーソーモチーフ」を基盤として拡張し、学習機能を実現するために新たに2種類の「活性化可能なゲートモチーフ」を開発しました 。まず学習フェーズでは、活性化可能な変換ゲートが用いられます 。ここに訓練データ(入力DNA)とクラスラベルDNAが同時に存在すると反応が起き、記憶の元となる活性化因子DNAが生成されます 。次にテストフェーズでは、活性化可能な増幅ゲートが主役となります。このゲートは普段「OFF」ですが、学習で生成された活性化因子DNAによって「ON」に切り替わり、テスト用の入力DNAと反応して重み付け計算を実行します。最終的に、この学習とテストの機能を統合した5層構造のネットワークとしてシステム全体が実装されています

設計における工夫と課題

この非常に複雑な分子システムを正しく動作させるため、設計段階で様々な工夫が凝らされました。特に、意図しない誤作動、すなわちクロストーク(誤反応)リーク(漏れ反応)を防ぐことが最重要課題でした。100ビットもの情報を扱うため、当初検討された単純な設計では特異性が不十分で不採用となりました 。また、学習反応が元に戻ってしまうことを防ぐ不可逆性も重要な設計要件でした。単純にゴミ処理分子を追加する方法では、未使用の分子が後のテスト反応を阻害する問題があったため、最終的には反応後の生成物自身が安定なヘアピン構造を形成することで、反応自体に不可逆性を組み込むという洗練された設計が採用されました。さらに、反応効率を上げるための「バルジ構造」は、リークを増やす副作用がありましたが、実験とシミュレーションを重ねて効率とリーク抑制のバランスが最適になるよう精密に調整されています

測定・解析方法

システムの動作は、蛍光キネティクス実験によってリアルタイムで測定・評価されています出力信号となる特定のDNA鎖が生成されると、レポーター分子と反応しますこのレポーター分子は、蛍光色素(フルオロフォア)と、その光を打ち消す消光剤(クエンチャー)が近くに配置されたDNA二重鎖です出力DNAがレポーターと反応すると、この二重鎖が解離して蛍光色素と消光剤が引き離され、強い蛍光が発せられるようになります

この蛍光強度の時間変化を測定することで、反応の進行度や最終的な出力濃度を定量的に知ることができます。2つの出力を同時に測定する場合は、それぞれ異なる色の光を出す蛍光色素が使われます

実験で得られたデータ(グラフ中の点線)は、化学反応の数理モデルに基づくシミュレーション結果(グラフ中の実線)と比較され、設計の妥当性やシステムの挙動の理解に用いられますまた、期待通りの値にならなかったビットを解析し、DNA中間体の二次構造形成が原因であることを突き止めるなど、エラー解析も詳細に行われています

研究のLimitationとPerspective (私見)

本研究の根本的な課題は、システムが一度しか計算できない「再利用性の欠如」です 。計算の過程でDNA燃料を消費し、システムが熱力学的平衡に達してしまうため、一度テストパターンを処理すると、次のパターンを処理することができません。これは実用化に向けた大きなハードルです。また、学習アルゴリズムが単純なため、現代のAIと比較して分類精度に限界があることや 、ON/OFFの二値信号しか扱えず連続的なアナログ値を処理できない柔軟性の低さも課題として挙げられます 。さらに、システムの規模を大きくしようとすると、回路内で使われなかった部品の割合が増え、それらがノイズ源となって性能を低下させるというスケーラビリティの問題も抱えています

それを踏まえ、今後の研究ではまず、この「使い切り」の性質を克服する持続可能な計算メカニズムの開発が不可欠です 。これにより、システムが継続的に動作できるようになれば、次の大きな目標である教師なし学習の実現が視野に入ります。教師なし学習は、システムが正解ラベルなしで環境から自律的に学ぶ能力であり、より生命らしい知能への重要なステップです 。さらに高度な学習のためには、ネットワーク自体の複雑さを増す必要があり、DNA凝縮体などを利用して反応空間を区切る「空間的組織化」の導入が、計算能力を飛躍的に向上させる鍵として期待されています

これらの課題が克服されれば、体内で病状を学習する治療薬や、経験に応じて自己修復する材料など、知的な分子システムの応用が現実のものとなると考えられます。