データサイエンスが学べる大学院・研究室の選び方3つ

人工知能などを含む広い意味のデータ科学が学べる大学院は国内外にたくさんありますが、だからこそどこに行けばいいのか迷ってしまうのも事実です。そこで、完全に私見ですがどのような基準で大学院を選ぶといいのかまとめてみます。医療に特化した唯一の国立大学である東京医科歯科大学が重点研究領域として立ち上げたデータ科学センターの現役の研究者なので、これから大学院に入学しようという学生さんに少しは役立ててもらえると思います。

それぞれクリックすると詳細が開きます。

データサイエンスは幅広い領域にまたがっています。正直なところ一般的なデータ解析の技術を大学院で学ぶのはとても効率が悪いと思います。世の中にはすでにさまざまな良書や動画があり、よくある解析についてはそれらに丁寧にまとめられています。

大学院で学ぶデータサイエンスとはそれらの一般的な書籍を勉強するレベルを超えた、特定の領域の研究活動です。高い専門性が要求される反面、カバーしている領域はごく一部のみです。

したがってデータサイエンスが学べる大学院を探す前に、自分がどのような分野のデータサイエンスを学びたいのか (=どのような分野の研究をしたいのか) を明確にする必要があります。

データサイエンスと一言にいっても例えば統計学と深層学習と数理モデリングではそれぞれ研究者が違いますし、同じ深層学習であっても画像AIと自然言語処理AIでは適切なラボは違いますし、自動運転のようなことをやりたければ純粋な情報学というよりはより工学的な研究室の方がいいでしょう。

もちろんそれは私が専門とする医学研究についても同じで、生命科学や医学におけるデータサイエンスを学びたいのであればそのようなラボの中から選ぶ必要があります。

よく「データサイエンスが学べる大学院を探している」という相談を受けるのですが、しばしば「データサイエンス」以外のことをあまり考えていない人を見かけます。どのような領域のデータサイエンスなのか、それをまず自分自身でよく考えましょう。もしそれが創薬や医療、生命科学といった広い意味の生物学領域のデータサイエンスなら、もう少し詳しいご相談にのれるかもしれませんので、メールください。

データサイエンスを銘打っているのにも関わらず、そこの大学院生が自分のノートパソコンしか計算資源を持っていないということがしばしばあります。

特に人工知能は巨大なモデルがどんどん開発されてきており、世界に対抗するためにはGPUを使えるようなスーパーコンピューターの使用が不可欠です。どの程度の計算リソースを持っている研究室なのかは、そのラボに入ってからの自分の研究の上限を決めてしまいますので願書を出す前にしっかりと確認しておくべきです。

また、計算リソースがあってもそれだけだと一握りのスーパールーキーはOKでしょうが残りの大多数の学生は困ってしまうでしょう。ラボ内における教育体制や、ラボメンバーが使用できるたくさんの書籍、あるいは独自の教育リソースを持っているかなど、そのラボに入った後も自分が大きく成長できそうな環境なのかを考えるといいでしょう。

 

3つ目の条件は人間性に関わるところです。大学院は学部とは違って同じ研究室に年単位で所属することになります。実験系の大学院では居室にずっといることは稀ですが、データサイエンスの研究室だと朝から晩まで同じ部屋に同じメンバーがいるということも珍しくありません。そういう人たちが、自分と相性の悪い人だと大学院生活は一気にハードモードになりますし、逆に打ち解けて一緒にdiscussionすることができたり有益な情報などを何でもシェアしあえるような文化があれば、精神的も研究の観点からも大学院生活が実り多いものになります。

また、その研究室のボス (一般的には教授ですが、不在時などの場合は事実上のトップの先生) がどんな人なのかも重要です。まずあまりベテランすぎる先生は避けた方がいいかもしれません。大学院を卒業したあとも、特に研究者になる場合には、節目節目で推薦書を求められます。大学院を卒業した10年後も現役の研究者をしていて推薦書を書いてくださりそうな年齢の先生の方が望ましいと思います。そして当然ながら指導方針は先生によって十人十色です。ボスが細かいところまで指示して大学院生は歯車の1つのように言われた仕事をこなしているだけというラボもあれば、逆にテーマの設定から全て大学院生任せというラボもあります。教授室は常に締め切っていて、隣の部屋にいても電話で前もって予約をとってからでないと教授に会えないというラボもあれば、教授室が半開きになっていていつでもアポ無しでdiscussionできるラボもあります。自分がどのように指導してほしいかということと、ボスの指導方針に大きな乖離があると入ったあと大変です。

コロナの時代でなかなか難しいとは思いますが、可能な限りお目当ての先生の研究室を訪問させていただき、どのようなメンバーなのかを含めて考えるとよいでしょう。

自分にとって理想的な先生にめぐり会えるといいですね。近い将来、データサイエンスコミュニティーでお会いできるのを楽しみにしています。

東京医科歯科大学・M&Dデータ科学センター・AIシステム医科学分野 清水秀幸