バイオメディカルDX for ALL

東京科学大学 (Science Tokyo) 総合研究院M&Dデータ科学センター、ならびに大学院医歯学総合研究科「AIシステム医科学分野」は、AIやシステム生物学、バイオインフォマティクスなど、いわゆる「dry系」の手法を得意にする研究室です。

私ごとで恐縮ですが、医学生がプログラミングを学ぶというのがまだ相当珍しかった時代にバイオインフォマティクスに足を踏み入れる最初のきっかけは何だったかと思い返してみると、学部2年の時に生協でたまたま見つけて購入した「バイオデータベースとウェブツールの手とり足とり活用法」(羊土社) にたどりつきます。タイトルに偽りなくさまざまなバイオデータベースの使い方がスクリーンショットとともに解説されていて、下宿先の小さな部屋で紹介されている全てのツールの全ての機能を使って覚えたのが最初のきっかけでした。

現在はその本が出た2007年とは比べ物にならないほど大量のデータが公共にも蓄積しており、適切なツールさえ知っていればそれらの膨大なデータからまさに「宝探し」ができるようになっています。

学部2年生の時に購入した書籍。このフィールドに入る最初のきっかけの1つ。残念ながら2007年以降この本は更新されていないのですが、この講習会ではコンセプトを引き継ぎつつ最新の情勢を疾患のインフォマティクスとも絡めながらお伝えします。

そして絶対にお伝えしたい大事なことは、「宝探し」を始めるにあたっては必ずしも難しい数式の理解や呪文のようなプログラミングスキルは必要ないということです。学部2年の頃の私がそうであったように、マウスやクリック操作で完結するツールだけでもかなりいろいろなことが分かることを、その驚き・ワクワクを、ぜひ体験していただきたい、そのような思いからドライ解析の全くの初心者の方向けにオンライン講習を開催させていただく運びとなりました。

ご参加いただける方

対象は大学教養程度の生命科学を学んだことがある方で、これまでほとんどコンピューター解析の経験がない方 (少しでも次世代シークエンサーなどのデータ解析経験がある方には入門すぎる内容です)。研究を開始してまだ日が浅い生命科学系の学生さんを主に想定していますが、ベテラン研究者の方でも社会人の方でも、(すぐ下にご案内する3点をお守りいただける方であれば)どなたでもご参加いただけます

  • 資料は専用のslackでPDFファイルの形でシェアさせていただきますが、著作権等は一切放棄しておりませんので再配布等はご遠慮いただける方。あくまで自習目的のみでお使いください。
  • 12月および1月、水曜日18時から19時までオンライン (zoom) で全5回開催いたしますが、原則として全5回とも参加できる方
  • この講習会は今回が初めてですが、次回以降の改善に向け、簡単なwebアンケートとword 1/3程度の分量の感想文を、全5回終了後2週間以内 (2/5 (水) まで) にご提出いただける方。その感想については私達の活動報告としてこちらのページのように「参加者の声」として匿名の形で公開させていただきます (これはバイオメディカルAI夏の学校という別の講習会でいただいたものです)。

今回の定員は100名です。事後に一般向けにオンデマンド配信の予定はございませんが、アンケートの結果も見ながら2025年度にも同様の講習会を計画しております。

日程と内容

社会人の方も参加していただきやすいよう、開始時間を18時とし、1時間限定で集中的に濃密な演習を行います。一緒に手を動かしていただくこともできますが、数日前までに共有するPDF資料を見て一度ご自身でそれらのツールに触れていただき、講習会当日は実演する内容や口頭で補足することをPDF資料に書き込みながらご視聴いただいた上で、後日それを見ながらもう一度ご自身で触ってみるというのが最もよいかと思われます。時間に限りがございますので、それを身につけていただくには予習・復習が必要になるということです。

第1回: 12/4 (水) 18:00-19:00 (オンラインzoom開催) / 数式なし、プログラミングなし

まずはがん患者さんのデータ解析からスタートします。臨床データと遺伝子発現データを紐づけながら予後に差がつく遺伝子を調べ、その遺伝子に関する文献検索のtipsを扱います。そして情報収集の自動化などDxの話題もシェアします。続いてその遺伝子のゲノム配列や遺伝子発現に関する情報などの検索の仕方や、データベースの見方をご説明します。その転写産物、翻訳産物 (アミノ酸配列) の取得方法や、ゲノム全域に対するモチーフ検索の方法もカバーします。

第2回: 12/11 (水) 18:00-19:00 (オンラインzoom開催) / 数式なし、プログラミングなし

第1回でがんの臨床データ解析から見出した遺伝子について、より詳細なゲノム情報取得をまず行います。具体的には、その遺伝子の多型と疾患との関わり、細胞種ごとの遺伝子発現や発現量と関連の深いSNP、多型の機能予測、GWASデータの扱い、ヒトゲノム計画以降の参照ゲノムの取り決めなどについて入門的な内容を共有します。また、最も多く行われている実験の1つと言っても過言ではないPCR産物をin silicoで簡単に得る方法や、遺伝子断片を全ゲノムに対して検索する方法についても扱います。

第3回: 12/18 (水) 18:00-19:00 (オンラインzoom開催) / 数式なし、プログラミングなし

次世代シークエンサー (NGS) 解析はもはやほとんど全てのライフサイエンス系の研究に使われているといっても過言ではありません。公共データになっているそのようなデータの探し方や、RNA-seqのごく基本的な解析を学びます。また、そこで見出した発現変動遺伝子群の意味づけやパスウェイ解析についても体験していただきます。最後に、さまざまなシングルセルRNA-seq (scRNA-seq) データをまとめて探索する方法についてもご紹介します。

第4回: 2025/1/8 (水) 18:00-19:00 (オンラインzoom開催) / 数式なし、プログラミングなし

第1回から引き続き行われている遺伝子を題材に、タンパク質の配列だけでなく機能や局在、結合タンパク質に関するデータの抽出方法をご紹介します。ノーベル賞をとったAlphaFold2時代のタンパク質の構造に関するデータや知見の取得についても近年の取り組みをかいつまんで演習します。後半では、化合物や薬に関するインフォマティクス、それらを細胞にかけた時の摂動予測などについてもご紹介します。

第5回: 2025/1/22 (水) 18:00-19:00 (オンラインzoom開催) / 数式なし、プログラミングほんの少しあり (コピペできます)

第4回まででたくさんのデータベースやツールを使ってきましたが、このようなものはどんどん素晴らしいものが出てきます。そこで最終回では、まずそういったマウスクリックで操作できる有用なツールに関する情報はどうやって入手すればいいのかをいくつかご紹介します。また、Dxのキーワードは「自動化」ですが、ウェブ操作やデータダウンロードの自動化についても少し学びます。最後に、もう少し専門的なバイオ・クリニカルインフォマティクスや、バイオメディカルAIを学ぶ上でのロードマップやリソースを提示します。

申し込み方法

希望者の方は11/28 (木) までに下記のフォームからお申し込みください。応募者多数の場合には抽選の上で11/29 (金) にメールでお知らせします。受講いただけることになった方については専用のslackへご招待します。