バイオメディカルDX for ALL

東京科学大学 (Science Tokyo) 総合研究院M&Dデータ科学センター、ならびに大学院医歯学総合研究科「AIシステム医科学分野」は、AIやシステム生物学、バイオインフォマティクスなど、いわゆる「dry系」の手法を得意にする研究室です。

私ごとで恐縮ですが、医学生がプログラミングを学ぶというのがまだ相当珍しかった時代にバイオインフォマティクスに足を踏み入れる最初のきっかけは何だったかと思い返してみると、学部2年の時に生協でたまたま見つけて購入した「バイオデータベースとウェブツールの手とり足とり活用法」(羊土社) にたどりつきます。タイトルに偽りなくさまざまなバイオデータベースの使い方がスクリーンショットとともに解説されていて、下宿先の小さな部屋で紹介されている全てのツールの全ての機能を使って覚えたのが最初のきっかけでした。

現在はその本が出た2007年とは比べ物にならないほど大量のデータが公共にも蓄積しており、適切なツールさえ知っていればそれらの膨大なデータからまさに「宝探し」ができるようになっています。

学部2年生の時に購入した書籍。このフィールドに入る最初のきっかけの1つ。残念ながら2007年以降この本は更新されていないのですが、この講習会ではコンセプトを引き継ぎつつ最新の情勢を疾患のインフォマティクスとも絡めながらお伝えします。

そして絶対にお伝えしたい大事なことは、「宝探し」を始めるにあたっては必ずしも難しい数式の理解や呪文のようなプログラミングスキルは必要ないということです。学部2年の頃の私がそうであったように、マウスやクリック操作で完結するツールだけでもかなりいろいろなことが分かることを、その驚き・ワクワクを、ぜひ体験していただきたい、そのような思いからドライ解析の全くの初心者の方向けにオンライン講習を開催させていただく運びとなりました。

昨年度受講した方の声

2025年度に受講した方からいただいた感想の一部を共有します。他の方からいただいたコメントもこちらで全部公開しておりますので合わせてご覧ください。

かなり基本的な所からあまりなじみのないところまで幅広く取り扱っていただき、大変勉強になりました。先生も大変お忙しい中と思いますが、このような講座が無償で、かつ受けやすい時間帯に開講いただいていること大変感謝いたします。私は基本的なウェットな分子細胞生物学と遺伝子クローニングなどの経験があるため、第1回、第2回は少し簡単に感じましたが良い復習でした。第3回-第4回などはこれまであまり実務では回してこなかった部分でしたので大変参考になりました。RNA-seqの解析等も以前は結構タフな解析を行うイメージだったのですが、無償で扱えるツールがこれだけ広く揃っていることが今回勉強出来ましたので、そろそろ実施しない言い訳が無いなと思い始めており、今回をきっかけに更に実務に取り入れていきたいと思います。また公開されているデータの再解析なども新たな知見の抽出に繋がりそうなイメージが出来ました。復習かねて再チャレンジします。また最先端の研究を実施されている皆さんも最近はGemini等でコードを書いているということで、私も引き続きGeminiにお世話になりながら本分野での学習を進めたいと思います。また次回の講座を楽しみにしています。
本講習会は、バイオ系のデータサイエンスをこれから始めたい人にとってとても心強い講習会だと感じました。全5回を通して、文献の探し方、ゲノムブラウザの基礎、RNA-seq解析、パスウェイ解析、AlphaFoldなどの基礎から応用までのトピックスが段階的に紹介され、そもそもバイオデータにどうやってアクセスするのか、どこに何の情報があるのかなどを知らなかった自分にはとても有難い構成になっていました。RSSを使って文献の情報収集を自動化するやり方などはバイオインフォをやらない人にとっても有益な情報になると思いました。また、応用系のテーマではタンパク質の結合相手を探す方法や、Web上で行うRNA-Seq解析が特に印象に残りました。いずれも特別なソフトや環境設定なしに誰でも無料で利用でき、敷居が高いと感じていたデータ解析のハードルが今回講習会を受けて下がったように感じます。 本講習会はデータ解析手法を俯瞰的に捉えることができるため、データ解析を実際にはじめたいと考えている方はもちろんですが、そうでない方もデータサイエンスの教養を身につける上でよい機会になると思います。

ご参加いただける方

対象は大学教養程度の生命科学を学んだことがある方で、これまでほとんどコンピューター解析の経験がない方 (少しでも次世代シークエンサーなどのデータ解析経験がある方には入門すぎる内容です)。研究を開始してまだ日が浅い生命科学系の学生さんを主に想定していますが、ベテラン研究者の方でも社会人の方でも、(すぐ下にご案内する3点をお守りいただける方であれば)どなたでもご参加いただけます

  • 資料は専用のslackでPDFファイルの形でシェアさせていただきますが、著作権等は一切放棄しておりませんので再配布等はご遠慮いただける方。あくまで自習目的のみでお使いください。
  • 12月および1月、原則として水曜日18:30から19:30までオンライン (zoom) で全5回開催いたしますが、全5回とも参加できる方
  • この講習会は今回が2回目ですが、次回以降の改善に向け、簡単なwebアンケートとword 1/3程度の分量の感想文を、全5回終了後2週間以内 (2/3 (水) まで) にご提出いただける方。その感想については私達の活動報告としてこちらのページのように「参加者の声」として匿名の形で公開させていただきます 。

今回の定員は100名です。事後に一般向けにオンデマンド配信の予定はございませんが、アンケートの結果も見ながら2026年度にも同様の講習会を計画しております。

日程と内容

社会人の方も参加していただきやすいよう、開始時間を18:30とし、1時間限定で集中的に濃密な演習を行います。一緒に手を動かしていただくこともできますが、数日前までに共有するPDF資料を見て一度ご自身でそれらのツールに触れていただき、講習会当日は実演する内容や口頭で補足することをPDF資料に書き込みながらご視聴いただいた上で、後日それを見ながらもう一度ご自身で触ってみるというのが最もよいかと思われます。時間に限りがございますので、それを身につけていただくには予習・復習が必要になるということです。

第1回: 12/2 (火) 火曜日開催ですのでご注意ください 18:30-19:30 (オンラインzoom開催) / 数式なし、プログラミングなし

まずはがん患者さんのデータ解析からスタートします。臨床データと遺伝子発現データを紐づけながら予後に差がつく遺伝子を調べ、その遺伝子に関する文献検索のtipsを扱います。そして情報収集の自動化などDxの話題もシェアします。続いてその遺伝子のゲノム配列や遺伝子発現に関する情報などの検索の仕方や、データベースの見方をご説明します。その転写産物、翻訳産物 (アミノ酸配列) の取得方法や、ゲノム全域に対するモチーフ検索の方法もカバーします。

第2回: 12/10 (水) 18:30-19:30 (オンラインzoom開催) / 数式なし、プログラミングなし

第1回でがんの臨床データ解析から見出した遺伝子について、より詳細なゲノム情報取得をまず行います。具体的には、その遺伝子の多型と疾患との関わり、細胞種ごとの遺伝子発現や発現量と関連の深いSNP、多型の機能予測、GWASデータの扱い、ヒトゲノム計画以降の参照ゲノムの取り決めなどについて入門的な内容を共有します。また、最も多く行われている実験の1つと言っても過言ではないPCR産物をin silicoで簡単に得る方法や、遺伝子断片を全ゲノムに対して検索する方法についても扱います。

第3回: 2026/1/7 (水) 18:30-19:30 (オンラインzoom開催) / 数式なし、プログラミングなし

次世代シークエンサー (NGS) 解析はもはやほとんど全てのライフサイエンス系の研究に使われているといっても過言ではありません。公共データになっているそのようなデータの探し方や、RNA-seqのごく基本的な解析を学びます。また、そこで見出した発現変動遺伝子群の意味づけやパスウェイ解析についても体験していただきます。最後に、さまざまなシングルセルRNA-seq (scRNA-seq) データをまとめて探索する方法についてもご紹介します。

第4回: 2026/1/14 (水) 18:30-19:30 (オンラインzoom開催) / 数式なし、プログラミングなし

第1回から引き続き行われている遺伝子を題材に、タンパク質の配列だけでなく機能や局在、結合タンパク質に関するデータの抽出方法をご紹介します。ノーベル賞をとったAlphaFold2時代のタンパク質の構造に関するデータや知見の取得についても近年の取り組みをかいつまんで演習します。後半では、化合物や薬に関するインフォマティクス、それらを細胞にかけた時の摂動予測などについてもご紹介します。

第5回: 2026/1/21 (水) 18:30-19:30 (オンラインzoom開催) / 数式なし、プログラミングほんの少しあり (コピペできます)

第4回まででたくさんのデータベースやツールを使ってきましたが、このようなものはどんどん素晴らしいものが出てきます。そこで最終回では、まずそういったマウスクリックで操作できる有用なツールに関する情報はどうやって入手すればいいのかをいくつかご紹介します。また、Dxのキーワードは「自動化」ですが、ウェブ操作やデータダウンロードの自動化についても少し学びます。最後に、もう少し専門的なバイオ・クリニカルインフォマティクスや、バイオメディカルAIを学ぶ上でのロードマップやリソースを提示します。

申し込み方法

希望者の方は11/29 (土) までに下記のフォームからお申し込みください。応募者多数の場合には抽選の上で11/30 (日) にメールでお知らせします。受講いただけることになった方については専用のslackへご招待します。