バイオメディカルAI「夏の学校」のご案内

データサイエンスやAIに関する言葉を聞かない日はないほど今日のデジタル社会にこれらは大きく浸透しています。現代の「読み・書き・そろばん」と言っても過言ではないでしょう。このような背景を受け、文部科学省も大学等が数理・データサイエンス・AI教育に取組むことを後押しする制度 (右図) を創設しました。書店にいけばたくさんの書籍があり、YouTubeやブログなどインターネットにもさまざまなコンテンツが共有されています。

しかし、それらの教材の多くは一般的なビジネス向けか、あるいはより理論的な側面を重視した専門家向けのどちらかであり、その両者の間が少ないように感じています。特に医療や生命科学領域のAIについては、独自の専門知識 (ドメイン知識) も必要になるためか、残念ながら学びたくてもそれほどは機会が多くないかと思います。

そこで、微力ながら少しでもそういった開かれた機会を提供させていただくため、夏の短期セミナーとして「バイオメディカルAI 夏の学校」を開催いたします。ゆくゆくはこの領域をご自身のフィールドに融合していただくための土台づくりとして、この夏の学校では文科省が定義するところの「応用基礎レベル」のハンズオンを中心にした構成になっています。また、「エキスパートレベル」の内容も一部盛り込んでいます。普段から第一線でAIを駆使している方には物足りない内容かと思いますが、市販の入門書等でAIを学びPythonによるプログラミング経験も多少ある方にとって、医療/ライフサイエンスAI領域の実践的な入口までの橋渡しとして最適な内容を目指しています (すでに生命医科学領域のご研究や事業などでAIをたくさん使っている方を対象とした専門家向けコースではございませんのでご留意ください)。今年度は初回なので至らぬ点も多々あるかと存じますが、ぜひ終了後にフィードバックをいただき次年度以降の改善につなげていきたいと考えております。以下、詳細です。

日時:  2024年8月3日(土)・ 8月4日(日)(実施時間帯:9:00~17:00)

開催形式: 現地 (東京医科歯科大学・駿河台キャンパス、最寄りはJR 御茶ノ水駅) + オンラインのハイブリッド開催。ただし現地をご希望いただいても、人数の関係からオンラインでのご参加をお願いすることがございます。

対象・参加費:  下記全て満たす方。参加費は無料

  1. 原則的に全日程 (土曜および日曜) に参加できる方。一部しか参加できない方もご事情を書いていただければ申込みができます。保護者の了解が得られれば高校生も参加可能です (が、2にあるように学部1年修了程度の知識を前提とさせていただきますのでご留意ください)。
  2. 前提として、理系学部における1年修了程度の数学 (線形代数・統計学)、生命科学 (分子細胞生物学) および医療概論に関する基礎知識をお持ちの方。これらの知識は夏の学校においては説明なしで使わせていただきます。
  3. 夏の学校ではプログラミング環境としてGoogle Colaboratoryを使うため、Googleアカウントをお持ちの方。その上で、Google Colaboratoryを自分で使ってみることが望ましい。
  4. Python 3 エンジニア認定基礎試験程度の一般的なPython事項については概ね理解している方。これに加えて、NumPy, Pandasといったデータサイエンスに必要な基本ライブラリー、および機械学習ではScikit-learn、深層学習ではPyTorchを使用するため、夏の学校までの間にチュートリアルを動かすなどして初歩的な使い方を学ぶことができる方。
  5. Linuxの初歩的なコマンド (pwd, cd, cp, mv, chmodくらいのもの) および初歩的な概念 (パス, 引数, オプションなど) については理解している方、あるいは夏の学校までに習得する意欲のある方 (スーパーコンピューター実習の際に初歩の事項については説明無しで使わせていただきます)

さらに下記3点のお願い事項を誓約いただける方。

  1. 配布資料やコード等について著作権は放棄しておりませんので個人の学習以外の用途 (再配布等) をしないと固くお約束いただける方。
  2. オンラインの方はカメラオンで参加できる方。現地の方も含め、我々の広報活動の一環として夏の学校の写真をとりwebや報告書に添えさせていただきます。
  3. 8月末までにアンケートおよび感想文 (次年度の参加者へのメッセージを含む。word 半~1ページ程度) を提出いただける方。感想文は2025年度に参加を検討している方に向けて匿名で「夏の学校」ページに掲載させていただきます。

日程 (内容は一部変更の可能性があります)

2024/8/2 (金、希望者のみ)

  • 17:30-19:00 Biomedical Data Science Club (希望者のみオンライン参加, エキスパートレベル): 全国の優秀な学生さんたちが隔週・オンラインで行っている論文輪読会へのゲスト参加です。詳細はこちら

2024/8/3 (土)

  • 9:00-9:50 医療AIの現在 (講義, 応用基礎レベル):  医療AIの現状について、事例ベースで概説します。
  • 10:00-10:50 生成AIによるPython自動プログラミング (講義, 応用基礎レベル): 生成AIの登場によりゼロからスクラッチでコードを書くことはかなり少なくなっています。どのようにプログラミングを加速させているのか、一例をお示しします。
  • 11:00-12:30 がんのトランスクリプトーム解析 (実習, 応用基礎レベル): バルクの遺伝子発現量データを公共データベースからダウンロードし、正常とがんを正しく分類する問題を通して、AIの基礎事項やバイオインフォマティクスとの接続を学びます。
  • 13:30-14:00 画像処理と自然言語処理の仕組み  (講義, 応用基礎レベル): 午後の実習で必要となる畳み込みとTransformerを概説します。
  • 14:00-14:50 医療画像への深層学習の応用 (実習, 応用基礎レベル): 医療AIで最も多いのは医療画像への適用ですが、ここでは胸部レントゲン画像の分類を通して自分で簡単なAIモデルを作ってみます。
  • 15:00-15:50 ゲノミクスへの深層学習の応用 (実習, エキスパートレベル): ゲノム科学へのAIの活用を通して、ゲノム情報の扱い方や情報の集約の仕方を学びます。
  • 16:00-16:50 大規模言語モデルのタンパク質科学への応用 (実習, エキスパートレベル): アミノ酸配列からタンパク質の立体構造はかなりしっかりと予測できるようになりました。ここでは、タンパクの機能や局在の予測といった課題に取り組んでいきます。
  • 17:00-18:00 TMDUツアー (対面参加の希望者のみ): 学内をご案内します。

2024/8/4 (日)

  • 9:00-9:50 疫学とAIの融合 (実習, エキスパートレベル): 従前からの医学研究では統計科学に基づく疫学から多くの知見が得られてきました。ここでは傾向スコアといった疫学の基本をコードを通して復習し、さらに近年隆盛を見せている機械学習との融合を体験していただきます。
  • 10:00-11:30 AI創薬入門 (実習, 応用基礎レベル): 2つのシンプルな課題を通じて、化合物の情報からその性質をAIで予測していきます。
  • 11:30-12:00 AI創薬の現況 (講義, エキスパートレベル): 昨今のAI創薬の現状や展望を、中分子創薬も交えて概説します
  • 13:00-14:25 スーパーコンピュータ体験 (実習, 応用基礎レベル): 夏の学校ではGoogle Colaboratoryを使いますが、今日のAI研究においては大規模計算機の利用が不可欠です。ここではスーパーコンピューターの仕組みを概説し、簡単なジョブを投げることを行います
  • 14:25-14:55 ソフト面でのAI高速化の工夫 (実習, 応用基礎レベル): スーパーコンピューターを使うというのはハードウェアとしてのアプローチですが、ソフト側の工夫 (コード側の工夫) でより高速なAIを実現する方法を実習形式で学びます。
  • 15:05-15:35 ここ5年ほどのAI研究の主要トピックス & 世界の動向 (講義, エキスパートレベル): 生成モデル、少データ学習など実習では時間の関係上扱うことができなかったが重要事項をキーになる数式も交えて概説します。また医療AIの社会実装において知らないといけない関連法規やグローバルな動向の概要をオムニバス的に紹介します。 
  • 15:40-16:10 生命医科学研究におけるAI研究の最前線 (講義, エキスパートレベル): AlphaFold3やRFDiffusion、他にも近年のバイオテクノロジーやその医療応用を大きく加速させる可能性を秘めている直近1-2年以内の最前線のAI技術を一部数式を交えて概説します。
  • 16:15-17:00 AIシステム医科学分野の紹介とさらなる修得に向けて: 夏の学校を終えた後にさらにどのようなことを学んでいけばいいのか、当分野の取り組みも含めてご紹介します。
  • 17:00-18:00 座談会 (対面参加の希望者のみ): 当研究室所属の学生さん達とフリーでいろいろお話いただけます。

当日までの準備について:

  • いただいたメールアドレスに夏の学校2024参加者限定のslackへ招待しますので、メンバーになっておいてください。資料等の共有は全てそちらで行います。また質問事項は所属とフルネームを名乗っていただいた上で、参加者全員が見えるチャンネル上でお願いいたします。ダイレクトメッセージ (DM) 等でのご質問は対応できません。
  • (まだ変更の可能性はありますが) 実習の一部にスーパーコンピュータを使うものがあります。詳細は7月になってからご案内いたしますが、資料PDFをみながらスパコンへログインまではご自身で行っていただくことになります。

当日について:

  • 現地参加の方は昼食の準備を忘れずにお願いいたします (コンビニでよければ、会場から徒歩1分の場所にセブンイレブンがございます)。駐車場はございませんので、公共交通機関を使ってお越しください。JR御茶ノ水駅から徒歩5分です。
  • 本イベントは無料開催ですので事故・不具合等への補償は一切できかねます。つまり現地参加のために移動中に怪我をしたとか、オンライン参加中に通信が不安定になった等のトラブルの際に我々が責任を持つことはできません。
  • 欠席の方のための後日のオンデマンド配信の予定はございません。夏の学校は当日限りです。

後日のことについて:

ご参加いただいた後に簡単なアンケートをお送りいたします。その回答、およびweb掲載用の感想文 (次年度受講者へのメッセージを含む) を8月末までにメール等で提出いただいた時点で夏の学校の修了となります。修了者には修了証をPDFで発行いたします。「夏の学校」は応用基礎レベルを中心にした構成になっていますが、さらに上のレベルのイベント (「夏の学校advanced」など) を当研究室が将来的に実施する際には「夏の学校」の修了証を持っていることを応募の必須要件とさせていただく予定です。

募集定員: 疑問点が出た際に対応させていただくスタッフの人数の関係から、恐れ入りますが定員を設けさせていただきます。1次募集・2次募集合わせて50名です。

  • ~6月末まで (1次募集) : 40名。結果をメールで7/2 (火) にお送りします。
  • 7月2~21日 (2次募集, 学生限定): 10名。結果をメールで7/23 (火) にお送りします。

申し込み方法:

下記Googleフォームからご登録ください。他の方法 (メールなど) での応募はできません。原則として土日祝を除いて5日以内に受理のメールを差し上げますので、届いていない方はお手数ですが迷惑メールに誤分類されていないかを確認していただいてからお問い合わせください。