実験系のライフサイエンス研究者や医療系の先生方といった、いわゆるドライ系 (情報系) ではない先生方からしばしばデータベースやリソースについて聞かれます。そこで、この記事でははじめての学生さんでも直感的に使っていただける代表的なサイトやバイオリソースを紹介します。この手のツールはどんどん増えますので折に触れてアップデートします。ぜひブックマークして、研究や教育に利活用してください

より本格的にバイオメディカル領域の情報科学・データサイエンスを勉強したいという意欲的な学生さん向けには、学部生〜修士課程向けのオンライン勉強会Biomedical Data Science Clubや博士課程学生さん向けのダブルメンター制度、ポスドクの先生方向けのネクストキャリア制度も用意しています。

また、(数理&統計&情報解析系で私達が何か貢献できそうなことがあれば) データ解析はじめてコース共同研究・共同グラント申請等をご相談いただくのも歓迎しております。

研究支援サービス

日本語で書かれたチュートリアル

バイオインフォマティクスに関する各言語のツールレポジトリー

  • Biopython: Pythonによる生物学的コンピューティングのためのツール
  • Bioconda: バイオインフォマティクスソフトウェアに特化した conda パッケージマネージャのチャンネル。3000以上のツールが利用可能
  • Bioconductor: ハイスループットなゲノムデータ解析のためのRパッケージ集。
  • Bioperl: バイオインフォマティクスやゲノミクス・ライフサイエンスのためのPerlツール集。
  • BioJulia: プログラミング言語Juliaによるバイオインフォマティクス関連レポジトリー

オンライン共有

  • Code Ocean: コードやデータ、計算環境をまるごと共有するツール
  • figshare: 研究に関するさまざまなものを引用できる形で共有
  • protocols.io: 研究プロトコルの共有ツール
  • RStudio Cloud: ブラウザからRやRStudioを実行したり他の人と共有できるツール

作図・可視化関連リソース

  • PlotsOfData: ブラウザで箱ひげ図やバイオリンプロットといった代表的な図を書くことができるツール
  • R Graphical Manual: Rを使った作図レシピ集。書きたい図を選択するとそのコードが表示される

代表的な英語の情報源

  • Biostars: バイオインフォマティクスに関するQ&Aサイトおよび教育コンテンツ
  • RNA-Seq Blog: NGS関連の新しい研究を紹介するブログ
  • Towards Data Science: データサイエンスに関するブログ、さまざまな著者がいるので玉石混交
  • Towards AI: AIに関するブログ、さまざまな著者がいるので玉石混交
  • Youglish: 英単語を検索すると、その単語がYouTube動画でどのように発音されているか調べることができるツール

論文執筆支援ツール

  • DeepL : 多言語翻訳ができる。ただし無料版は翻訳内容がサーバーに送られるので,未発表の研究内容の翻訳には注意が必要
  • みらい翻訳: 日本製の自動翻訳ツール
  • Grammarly: 論文校正依頼する前に自分で誤字脱字や文法エラーを確認できる。
  • QuillBot: 文章をネイティブ風に書き換えてくれる
  • Overleaf : 環境構築が不要で,オンラインでtexを使用できる。
  • Togo picture gallery: 誰でも自由に使える生命科学系のイラスト集
  • Mathpix: ドキュメントの数式やテーブルを簡単にLatex形式に変換

代表的なプリプリントサーバー

  • arXiv: 情報・数学・物理系が主だがバイオもあり。URLを入力すると関連論文を表示するarXiv Xplorerも稼働中
  • bioRxiv: バイオ系中心
  • medRxiv: 臨床医学系中心
  • ChemRxiv: 化学系中心

プロトコル集

  • Current Protocols: Molecular Biology, Cell Biology, Bioinformaticsなど複数のテーマに分かれており、それぞれには基礎からadvancedな手法が網羅されている
  • Cold Spring Harbor Protocols: 分子生物学で高名な研究所が出すプロトコル集。最先端の手法というよりもベーシックな手法をきっちり原理にまで立ち返って説明するものが多い
  • Nature Protocols: 上記の対極。かなりAdvancedな最新の手法しか掲載されない。初学者には向かないが、ある程度の経験者なら自分のラボでも試行錯誤しながら系をセットアップできるだろう。
  • Methods in molecular biology: 1冊ごと読み切りでテーマが変わる。1980年代から2500冊近く発行されており、多様な手法がカバーされている
  • JoVE: 実験プロトコルを動画も併用して伝えるという新しいコンセプトの雑誌。動画なので初めての手技もわかりやすい。

まず知っておきたいド定番のリソース

  • PubMed: ライフサイエンス系の論文検索エンジン
  • NCBI Genome Data Viewer: さまざまな生物種のゲノム情報を視覚的に検索
  • UCSC Genome Browser: ゲノムや周辺情報の可視化ができるゲノムブラウザ
  • Ensembl Genome Browser: EMBLが提供する最新のゲノムブラウザ
  • NCBI BLAST: 塩基配列やアミノ酸配列からそれが何かを検索
  • Sequence Read Archive (SRA): 次世代シークエンスデータのレポジトリー
  • Digital Expression Explorer 2: SRAに公開されたRNA-seqデータの解析済みデータをダウンロードできる
  • UniProt: タンパク質に関する統合データベース
  • PDBj: タンパク質構造データの日本語ポータルサイト
  • jPOST: プロテオームデータを閲覧・ダウンロードできるレポジトリー
  • HOMCOS: タンパク質の結合立体構造検索 & モデリング
  • Reactome:  パスウェイデータベース

ブラウザで完結するRNA-seq解析ツール

  • Galaxy: ブラウザで完結するRNA-seq解析ツール (他のバイオインフォ解析もできる)
  • iDEP: ブラウザで完結するRNA-seq解析ツール
  • BioJupies: ブラウザで完結するRNA-seq解析ツール
  • RaNA-seq: ブラウザで完結するRNA-seq解析ツール

エンリッチメント解析ツール

  • David: 興味のある遺伝子セットに対するエンリッチメント解析を行うツール
  • Metascape: Webで直感的に利用できるグラフィカルなエンリッチメント解析ツール
  • Enrichr: 疾患や細胞株などさまざまな分野のデータベースに対してエンリッチメント解析が行えるツール
  • WebCSEA: 細胞特異的な遺伝子発現エンリッチメント解析 

COVID-19関連

  • COVID19db: SARS-CoV-2トランスクリプトームと創薬 
  • CoV3D: コロナウイルスの実験的で解き明かされたタンパク質構造データベース 
  • DockCoV2: SARS-CoV2標的に対するインシリコ薬物ドッキング
  • Ensembl COVID-19 resource : SARS-CoV-2の統合公開データ 
  • ESC: SARS-CoV-2免疫逃避バリアント 
  • LitCovid: NCBIが運営するCOVID-19のキュレーション文献データベース
  • PAGER-COV: COVID-19に関連するパスウェイと遺伝子リスト
  • SCoV2-MD: SARS-CoV-2タンパク質のMD計算とバリアント解釈
  • T-cell COVID-19 Atlas: SARS-CoV-2ペプチドとHLAアレルとの親和性の予測
  • VarEPS: SARS-CoV-2バリアントや治療法

ゲノム関係

  • 3′aQTL-atlas: ヒト正常組織における3′UTR alternative polyadenylation quantitative trait lociアトラス。
  • 3DGenBench: 3Dゲノミクスのための計算モデルのベンチマーク
  • Animal-eRNAdb : 動物10種類のエンハンサー のデータベース
  • ASMdb: アリル特異的DNAメチル化データベース 
  • ChIP-Atlas: 公開ChIP-seqデータをブラウザで閲覧
  • CircleBase: ヒト染色体外の環状DNA
  • CompoDynamics: ゲノム間の塩基配列の構成と特徴 
  • CyanoOmicsDB: シアノバクテリアのゲノミクスとトランスクリプトミクス
  • EVA: ヨーロッパのゲノムバリエーションのアーカイブ
  • EWAS Open Platform: EWAS (epigenome-wide association studies) 研究のための解析プラットフォーム
  • LIRBase: 真核生物における長い逆方向反復配列 
  • Nucleome Data Bank: 3Dゲノム構造とシミュレーション 
  • miRNASNP: miRNA関連SNPsおよび変異
  • MitImpact: ヒトミトコンドリアゲノム変異の計算済み病原性予測
  • PheLiGe: 遺伝子型と表現型の関連性
  • PhyloCloud: 系統樹のためのツール
  • SomaMutDB: ヒト正常組織における体細胞突然変異 

ゲノム編集関係

  • AcrDB: Anti-CRISPRオペロンデータベース 
  • AcrHub: Anti-CRISPRタンパクデータベース
  • crisprSQL: CRISPR/Cas9オフターゲットに関するデータベース
  • CRISPR-view: CRISPRによる機能スクリーニングデータ

癌関係

  • CancerImmunityQTL: 複数のがん種の遺伝子と免疫療法間のQTL解析
  • CancerMIRNome: TCGAや血中におけるmiRNAデータベース
  • CancerSCEM: がんにおける1細胞レベルでの遺伝子発現データ
  • CellMinerCDB: 細胞株ベースのファーマコゲノミクスデータセット
  • CTR-DB: がん患者由来の臨床トランスクリプトームと薬物反応
  • lncRNAfunc: がんにおけるlncRNAの役割 
  • GPEdit: がんにおけるA-to-I RNA編集
  • OncoDB: がんにおける遺伝子発現とウイルス感染
  • OncoVar: がんのドライバー変異、遺伝子、パスウェイ
  • Open Targets Genetics: 遺伝子データから創薬標的の優先順位付けを行う 
  • Project Score: Sanger研究所が提供するCRISPR-Cas9スクリーニングによるがん依存性の特定
  • SPENCER: がんにおいてnon-coding RNAにコードされるペプチド
  • TISMO: マウスの腫瘍モデル 

遺伝子発現制御

  • Bgee: 野生型の動物における遺伝子発現データをキュレーションしたもの 
  • cncRNAdb: コーディングRNAとノンコーディングRNAに関するデータベース
  • Gene Expression Nebulas: 生物種、バルク、単一細胞にまたがる発現プロファイル 
  • GRAND: ヒト組織、癌、細胞株、低分子薬剤から得られた遺伝子制御ネットワークコレクション
  • miTED: microRNA組織発現データベース
  • TF-Marker: 特に細胞マーカーとして働くヒト転写因子

タンパク関係

タンパク質-核酸

疾患情報関係

  • Aging Atlas: 加齢に伴うオミックスデータをまとめたデータベース
  • BrainBase: 脳疾患の知識データベース
  • circMine: 健康および疾患におけるヒトcircRNAのトランスクリプトーム
  • OlfactionBase: におい、におい物質、嗅覚受容体 
  • Regeneration Roadmap:  細胞再生に関する文献とマルチオミックスデータ

患者データ

シングルセル関係

  • DISCO: シングルセルオミクスの統合
  • scEnhancer: ヒト・マウス・ハエの1細胞エンハンサーアノテーション
  • scMethBank: シングルセルメチル化データ

その他NGSデータ

  • CSEA-DB: 細胞型別の遺伝形質データベース 
  • GeneLab: NASAが提供する宇宙生物学と電離放射線に関するオミックスデータ 
  • proCHiPdb:  原核生物のクロマチン免疫沈降データベース
  • webTWAS:  TWASアトラス

薬関係

 

  • CeDR: scRNA-seqから見る健康・疾病における薬物応答 
  • CovPDB: 共有結合の阻害剤とその複合体
  • DDinter: 薬物-薬物相互作用
  • DrugSpaceX: バーチャルスクリーニングのための1億化合物 
  • NCATS Inxight: Drugs: 薬物の性質と調節 
  • PK-DB: 臨床試験や前臨床試験で得られた薬物動態のデータ

生薬関係

  • CMNPD: 包括的な海洋天然物データベース
  • NPAtlas: 天然化合物アトラス
  • NPCDR: 医薬品と天然物の組み合わせと疾患  
  • NP-MRD:  天然物の磁気共鳴データベース 

免疫関係

 

  • INDI: ナノボディをさまざまなデータリソースから自動収集
  • SPICA: 免疫細胞解析のためのポータルサイト

微生物関係

  • AMDB: 動物のマイクロバイオームデータベース
  • ARTS-DB: 抗生物質耐性ターゲットデータベース
  • BastionHub: グラム陰性菌の分泌システムの基質データベース
  • BiG-FAM: 生合成遺伝子クラスター・ファミリーに関するデータベース
  • mBodyMap: 健康と病気における人体の微生物分布 
  • MVIP: 様々な生物種のウイルス感染下でのマルチオミクスデータ
  • NMDC Data Portal: 微生物のマルチオミクスデータポータル
  • Peryton: 微生物と疾病の関連性
  • VEuPathDB: 真核生物の病原体、ベクター、宿主の関係 
  • ViMIC:  ウイルスの変異やゲノムへのintegration部位、シス効果
  • ViroidDB: ウイロイドデータベース
  • VThunter:  scRNA-seqによる動物間でのウイルス受容体発現解析 
  • ZOVER: 人獣共通感染症とそのベクターやウイルス

植物関係

  • AtMAD: シロイヌナズナの マルチオミクス関連データベース
  • Cyanorak: シアノバクテリアの比較ゲノム解析
  • PCMDB: 植物の細胞マーカーデータベース
  • PlantGSAD: 植物の遺伝子セットアノテーション
  • qPTMplants: 植物における翻訳後修飾
  • Echinoderm genomics:  棘皮動物ゲノム解析 

各種メーカー