まず、BYOL (Bootstrap Your Own Latent, NeurIPS 2020) という自己教師あり学習の手法を用いて、大量のMRI画像からその特徴を効率的に抽出するための「基盤モデル」を事前学習させます。これは、ラベル(正解)なしのデータから画像の本質的な表現を学習する技術で、これにより装置の違いやノイズに強い特徴抽出器を構築できます。
モデルの学習効率と精度を高めるため、JLms (Joint loss under multilevel supervision) という複数の要素を組み合わせた独自の損失関数を設計しました。これは、最終的な予測の正しさ(多クラス交差エントロピー)だけでなく、モデル内部の複数経路から得られる予測の一貫性も同時に評価することで、複雑なネットワークの学習を安定させる工夫です。具体的には、T2WIという基本的なMRI画像だけを見て学習するモデルと、T2WI・DWI・ADCなど全てのMRI画像を駆使し、時間をかけて多角的に判断するモデルがあります。もちろんいろいろな画像を使う複雑なネットワークの方が優秀ですが、情報が多すぎるあまり、訓練の初期段階では間違った方向に考えを深めてしまう「迷走」を起こしがちです。そこで、T2WIしか使わないシンプルなモデルを一種のガイドとして使いそれと大きな矛盾のないように (特に初期では) 学習をすることで、AIモデル全体が間違った方向に進むことなく、安定して賢くなっていくと仕組みになっています。