実験系のライフサイエンス研究者や医療系の先生方といった、いわゆるドライ系 (情報系) ではない先生方からしばしばデータベースやリソースについて聞かれます。そこで、この記事でははじめての学生さんでも直感的に使っていただける代表的なサイトやバイオリソースを紹介します。この手のツールはどんどん増えますので折に触れてアップデートします。ぜひブックマークして、研究や教育に利活用してください。
より本格的にバイオメディカル領域の情報科学・データサイエンスを勉強したいという意欲的な学生さん向けには、学部生〜修士課程向けのオンライン勉強会Biomedical Data Science Clubや博士課程学生さん向けのダブルメンター制度、ポスドクの先生方向けのネクストキャリア制度も用意しています。
また、(数理&統計&情報解析系で私達が何か貢献できそうなことがあれば) データ解析はじめてコースや共同研究・共同グラント申請等をご相談いただくのも歓迎しております。
研究支援サービス
- 生命科学連携推進協議会: 科研費による研究を最先端で支援。コホート生体材料・先端バイオイメージング・先端モデル動物・先端ゲノム解析の4つの部門のもとにさまざまな支援が受けられる。
- ナショナルバイオリソースプロジェクト (NBRP): 動物・植物・微生物・細胞・情報を低額で供与してもらえるサービス
- ナショナルセンター・バイオバンクネットワーク (NCBN): 国立がん研究センターバイオバンク (がん組織)・国立循環器病研究センターバイオバンク (脳卒中や心筋梗塞)・国立精神・神経医療研究センターバイオバンク (脳と心の病気)・国立国際医療研究センターバイオバンク (感染症など)・国立成育医療研究センターバイオバンク (母と子供の病気)・国立長寿医療研究センターバイオバンク (認知症など高齢者の病気) について、豊富な臨床情報+試料が利用可能
- DNA Bank: 1992年に発足した遺伝子材料開発室が提供しているサービスで、さまざまなDNAパーツを1つ1万円ほどの手数料で提供してくれる
日本語で書かれたチュートリアル
- Python早見帳: Python入門を短時間で0から勉強したい人向け
- 疫学のための R ハンドブック: 疫学や公衆衛生領域のRコード付き実践練習教材
- TogoTV: 代表的なデータベースの使い方を動画で解説
バイオインフォマティクスに関する各言語のツールレポジトリー
- Biopython: Pythonによる生物学的コンピューティングのためのツール
- Bioconda: バイオインフォマティクスソフトウェアに特化した conda パッケージマネージャのチャンネル。3000以上のツールが利用可能
- Bioconductor: ハイスループットなゲノムデータ解析のためのRパッケージ集。
- Bioperl: バイオインフォマティクスやゲノミクス・ライフサイエンスのためのPerlツール集。
- BioJulia: プログラミング言語Juliaによるバイオインフォマティクス関連レポジトリー
オンライン共有
- Code Ocean: コードやデータ、計算環境をまるごと共有するツール
- figshare: 研究に関するさまざまなものを引用できる形で共有
- protocols.io: 研究プロトコルの共有ツール
- RStudio Cloud: ブラウザからRやRStudioを実行したり他の人と共有できるツール
作図・可視化関連リソース
- PlotsOfData: ブラウザで箱ひげ図やバイオリンプロットといった代表的な図を書くことができるツール
- R Graphical Manual: Rを使った作図レシピ集。書きたい図を選択するとそのコードが表示される
代表的な英語の情報源
- Biostars: バイオインフォマティクスに関するQ&Aサイトおよび教育コンテンツ
- RNA-Seq Blog: NGS関連の新しい研究を紹介するブログ
- Towards Data Science: データサイエンスに関するブログ、さまざまな著者がいるので玉石混交
- Towards AI: AIに関するブログ、さまざまな著者がいるので玉石混交
- Youglish: 英単語を検索すると、その単語がYouTube動画でどのように発音されているか調べることができるツール
論文執筆支援ツール
代表的なプリプリントサーバー
- arXiv: 情報・数学・物理系が主だがバイオもあり。URLを入力すると関連論文を表示するarXiv Xplorerも稼働中
- bioRxiv: バイオ系中心
- medRxiv: 臨床医学系中心
- ChemRxiv: 化学系中心
プロトコル集
- Current Protocols: Molecular Biology, Cell Biology, Bioinformaticsなど複数のテーマに分かれており、それぞれには基礎からadvancedな手法が網羅されている
- Cold Spring Harbor Protocols: 分子生物学で高名な研究所が出すプロトコル集。最先端の手法というよりもベーシックな手法をきっちり原理にまで立ち返って説明するものが多い
- Nature Protocols: 上記の対極。かなりAdvancedな最新の手法しか掲載されない。初学者には向かないが、ある程度の経験者なら自分のラボでも試行錯誤しながら系をセットアップできるだろう。
- Methods in molecular biology: 1冊ごと読み切りでテーマが変わる。1980年代から2500冊近く発行されており、多様な手法がカバーされている
- JoVE: 実験プロトコルを動画も併用して伝えるという新しいコンセプトの雑誌。動画なので初めての手技もわかりやすい。
まず知っておきたいド定番のリソース
- PubMed: ライフサイエンス系の論文検索エンジン
- NCBI Genome Data Viewer: さまざまな生物種のゲノム情報を視覚的に検索
- UCSC Genome Browser: ゲノムや周辺情報の可視化ができるゲノムブラウザ
- Ensembl Genome Browser: EMBLが提供する最新のゲノムブラウザ
- NCBI BLAST: 塩基配列やアミノ酸配列からそれが何かを検索
- Sequence Read Archive (SRA): 次世代シークエンスデータのレポジトリー
- Digital Expression Explorer 2: SRAに公開されたRNA-seqデータの解析済みデータをダウンロードできる
- UniProt: タンパク質に関する統合データベース
- PDBj: タンパク質構造データの日本語ポータルサイト
- jPOST: プロテオームデータを閲覧・ダウンロードできるレポジトリー
- HOMCOS: タンパク質の結合立体構造検索 & モデリング
- Reactome: パスウェイデータベース
ブラウザで完結するRNA-seq解析ツール
エンリッチメント解析ツール
COVID-19関連
- COVID19db: SARS-CoV-2トランスクリプトームと創薬
- CoV3D: コロナウイルスの実験的で解き明かされたタンパク質構造データベース
- DockCoV2: SARS-CoV2標的に対するインシリコ薬物ドッキング
- Ensembl COVID-19 resource : SARS-CoV-2の統合公開データ
- ESC: SARS-CoV-2免疫逃避バリアント
- LitCovid: NCBIが運営するCOVID-19のキュレーション文献データベース
- PAGER-COV: COVID-19に関連するパスウェイと遺伝子リスト
- SCoV2-MD: SARS-CoV-2タンパク質のMD計算とバリアント解釈
- T-cell COVID-19 Atlas: SARS-CoV-2ペプチドとHLAアレルとの親和性の予測
- VarEPS: SARS-CoV-2バリアントや治療法
ゲノム関係
- 3′aQTL-atlas: ヒト正常組織における3′UTR alternative polyadenylation quantitative trait lociアトラス。
- 3DGenBench: 3Dゲノミクスのための計算モデルのベンチマーク
- Animal-eRNAdb : 動物10種類のエンハンサー のデータベース
- ASMdb: アリル特異的DNAメチル化データベース
- ChIP-Atlas: 公開ChIP-seqデータをブラウザで閲覧
- CircleBase: ヒト染色体外の環状DNA
- CompoDynamics: ゲノム間の塩基配列の構成と特徴
- CyanoOmicsDB: シアノバクテリアのゲノミクスとトランスクリプトミクス
- EVA: ヨーロッパのゲノムバリエーションのアーカイブ
- EWAS Open Platform: EWAS (epigenome-wide association studies) 研究のための解析プラットフォーム
- LIRBase: 真核生物における長い逆方向反復配列
- Nucleome Data Bank: 3Dゲノム構造とシミュレーション
- miRNASNP: miRNA関連SNPsおよび変異
- MitImpact: ヒトミトコンドリアゲノム変異の計算済み病原性予測
- PheLiGe: 遺伝子型と表現型の関連性
- PhyloCloud: 系統樹のためのツール
- SomaMutDB: ヒト正常組織における体細胞突然変異
ゲノム編集関係
- AcrDB: Anti-CRISPRオペロンデータベース
- AcrHub: Anti-CRISPRタンパクデータベース
- crisprSQL: CRISPR/Cas9オフターゲットに関するデータベース
- CRISPR-view: CRISPRによる機能スクリーニングデータ
癌関係
- CancerImmunityQTL: 複数のがん種の遺伝子と免疫療法間のQTL解析
- CancerMIRNome: TCGAや血中におけるmiRNAデータベース
- CancerSCEM: がんにおける1細胞レベルでの遺伝子発現データ
- CellMinerCDB: 細胞株ベースのファーマコゲノミクスデータセット
- CTR-DB: がん患者由来の臨床トランスクリプトームと薬物反応
- lncRNAfunc: がんにおけるlncRNAの役割
- GPEdit: がんにおけるA-to-I RNA編集
- OncoDB: がんにおける遺伝子発現とウイルス感染
- OncoVar: がんのドライバー変異、遺伝子、パスウェイ
- Open Targets Genetics: 遺伝子データから創薬標的の優先順位付けを行う
- Project Score: Sanger研究所が提供するCRISPR-Cas9スクリーニングによるがん依存性の特定
- SPENCER: がんにおいてnon-coding RNAにコードされるペプチド
- TISMO: マウスの腫瘍モデル
遺伝子発現制御
- Bgee: 野生型の動物における遺伝子発現データをキュレーションしたもの
- cncRNAdb: コーディングRNAとノンコーディングRNAに関するデータベース
- Gene Expression Nebulas: 生物種、バルク、単一細胞にまたがる発現プロファイル
- GRAND: ヒト組織、癌、細胞株、低分子薬剤から得られた遺伝子制御ネットワークコレクション
- miTED: microRNA組織発現データベース
- TF-Marker: 特に細胞マーカーとして働くヒト転写因子
タンパク関係
- AlphaFold Protein Structure Database: AlphaFoldで予測されたタンパク質構造
- DKK: あまり探求されていないkinaseのデータベース
- GproteinDb: Gタンパク質とその相互作用
- Human Proteoform Atlas : ヒトのproteoformのデータベース
- Kincore: プロテインキナーゼの配列、構造、系統図
- FireProtDB: タンパク質の安定性データ
- ModelSEED Biochemistry: 生化学反応に関するデータベース
- SYNBIP: 合成された結合タンパク質 リスト
タンパク質-核酸
- ProNAB: タンパク質-核酸結合親和性データ
- The Protein–Nucleic Acid Thermodynamics Database (PNATDB): タンパクと核酸の実験的に得られた熱力学データを収録
疾患情報関係
- Aging Atlas: 加齢に伴うオミックスデータをまとめたデータベース
- BrainBase: 脳疾患の知識データベース
- circMine: 健康および疾患におけるヒトcircRNAのトランスクリプトーム
- OlfactionBase: におい、におい物質、嗅覚受容体
- Regeneration Roadmap: 細胞再生に関する文献とマルチオミックスデータ
患者データ
シングルセル関係
- DISCO: シングルセルオミクスの統合
- scEnhancer: ヒト・マウス・ハエの1細胞エンハンサーアノテーション
- scMethBank: シングルセルメチル化データ
その他NGSデータ
薬関係
- CeDR: scRNA-seqから見る健康・疾病における薬物応答
- CovPDB: 共有結合の阻害剤とその複合体
- DDinter: 薬物-薬物相互作用
- DrugSpaceX: バーチャルスクリーニングのための1億化合物
- NCATS Inxight: Drugs: 薬物の性質と調節
- PK-DB: 臨床試験や前臨床試験で得られた薬物動態のデータ
生薬関係
免疫関係
微生物関係
- AMDB: 動物のマイクロバイオームデータベース
- ARTS-DB: 抗生物質耐性ターゲットデータベース
- BastionHub: グラム陰性菌の分泌システムの基質データベース
- BiG-FAM: 生合成遺伝子クラスター・ファミリーに関するデータベース
- mBodyMap: 健康と病気における人体の微生物分布
- MVIP: 様々な生物種のウイルス感染下でのマルチオミクスデータ
- NMDC Data Portal: 微生物のマルチオミクスデータポータル
- Peryton: 微生物と疾病の関連性
- VEuPathDB: 真核生物の病原体、ベクター、宿主の関係
- ViMIC: ウイルスの変異やゲノムへのintegration部位、シス効果
- ViroidDB: ウイロイドデータベース
- VThunter: scRNA-seqによる動物間でのウイルス受容体発現解析
- ZOVER: 人獣共通感染症とそのベクターやウイルス
植物関係
- AtMAD: シロイヌナズナの マルチオミクス関連データベース
- Cyanorak: シアノバクテリアの比較ゲノム解析
- PCMDB: 植物の細胞マーカーデータベース
- PlantGSAD: 植物の遺伝子セットアノテーション
- qPTMplants: 植物における翻訳後修飾
- Echinoderm genomics: 棘皮動物ゲノム解析
各種メーカー
- ベクタービルダー: デザインしたベクターを作成してくれる会社