実験系のライフサイエンス研究者や医療系の先生方といった、いわゆるドライ系 (情報系) ではない先生方からしばしばデータベースやリソースについて聞かれます。そこで、この記事でははじめての学生さんでも直感的に使っていただける代表的なサイトやバイオリソースを紹介します。この手のツールはどんどん増えますので折に触れてアップデートします。ぜひブックマークして、研究や教育に利活用してください。より本格的にバイオメディカル領域の情報科学・データサイエンスを勉強したいという意欲的な学生さん向けには、学部生〜修士課程向けのオンライン勉強会Biomedical Data Science Clubや博士課程学生さん向けのダブルメンター制度、ポスドクの先生方向けのネクストキャリア制度も用意しています。また、(数理&統計&情報解析系で私達が何か貢献できそうなことがあれば) データ解析はじめてコースや共同研究・共同グラント申請等をご相談いただくのも歓迎しております。 研究支援サービス 生命科学連携推進協議会: 科研費による研究を最先端で支援。コホート生体材料・先端バイオイメージング・先端モデル動物・先端ゲノム解析の4つの部門のもとにさまざまな支援が受けられる。ナショナルバイオリソースプロジェクト (NBRP): 動物・植物・微生物・細胞・情報を低額で供与してもらえるサービスナショナルセンター・バイオバンクネットワーク (NCBN): 国立がん研究センターバイオバンク (がん組織)・国立循環器病研究センターバイオバンク (脳卒中や心筋梗塞)・国立精神・神経医療研究センターバイオバンク (脳と心の病気)・国立国際医療研究センターバイオバンク (感染症など)・国立成育医療研究センターバイオバンク (母と子供の病気)・国立長寿医療研究センターバイオバンク (認知症など高齢者の病気) について、豊富な臨床情報+試料が利用可能DNA Bank: 1992年に発足した遺伝子材料開発室が提供しているサービスで、さまざまなDNAパーツを1つ1万円ほどの手数料で提供してくれる 日本語で書かれたチュートリアル Python早見帳: Python入門を短時間で0から勉強したい人向け疫学のための R ハンドブック: 疫学や公衆衛生領域のRコード付き実践練習教材TogoTV: 代表的なデータベースの使い方を動画で解説 バイオインフォマティクスに関する各言語のツールレポジトリー Biopython: Pythonによる生物学的コンピューティングのためのツールBioconda: バイオインフォマティクスソフトウェアに特化した conda パッケージマネージャのチャンネル。3000以上のツールが利用可能Bioconductor: ハイスループットなゲノムデータ解析のためのRパッケージ集。Bioperl: バイオインフォマティクスやゲノミクス・ライフサイエンスのためのPerlツール集。BioJulia: プログラミング言語Juliaによるバイオインフォマティクス関連レポジトリー オンライン共有 Code Ocean: コードやデータ、計算環境をまるごと共有するツールfigshare: 研究に関するさまざまなものを引用できる形で共有protocols.io: 研究プロトコルの共有ツールRStudio Cloud: ブラウザからRやRStudioを実行したり他の人と共有できるツール 作図・可視化関連リソース PlotsOfData: ブラウザで箱ひげ図やバイオリンプロットといった代表的な図を書くことができるツールR Graphical Manual: Rを使った作図レシピ集。書きたい図を選択するとそのコードが表示される 代表的な英語の情報源 Biostars: バイオインフォマティクスに関するQ&Aサイトおよび教育コンテンツRNA-Seq Blog: NGS関連の新しい研究を紹介するブログTowards Data Science: データサイエンスに関するブログ、さまざまな著者がいるので玉石混交Towards AI: AIに関するブログ、さまざまな著者がいるので玉石混交Youglish: 英単語を検索すると、その単語がYouTube動画でどのように発音されているか調べることができるツール 論文執筆支援ツール DeepL : 多言語翻訳ができる。ただし無料版は翻訳内容がサーバーに送られるので,未発表の研究内容の翻訳には注意が必要みらい翻訳: 日本製の自動翻訳ツールGrammarly: 論文校正依頼する前に自分で誤字脱字や文法エラーを確認できる。QuillBot: 文章をネイティブ風に書き換えてくれるOverleaf : 環境構築が不要で,オンラインでtexを使用できる。Togo picture gallery: 誰でも自由に使える生命科学系のイラスト集Mathpix: ドキュメントの数式やテーブルを簡単にLatex形式に変換 代表的なプリプリントサーバー arXiv: 情報・数学・物理系が主だがバイオもあり。URLを入力すると関連論文を表示するarXiv Xplorerも稼働中bioRxiv: バイオ系中心medRxiv: 臨床医学系中心ChemRxiv: 化学系中心 プロトコル集 Current Protocols: Molecular Biology, Cell Biology, Bioinformaticsなど複数のテーマに分かれており、それぞれには基礎からadvancedな手法が網羅されているCold Spring Harbor Protocols: 分子生物学で高名な研究所が出すプロトコル集。最先端の手法というよりもベーシックな手法をきっちり原理にまで立ち返って説明するものが多いNature Protocols: 上記の対極。かなりAdvancedな最新の手法しか掲載されない。初学者には向かないが、ある程度の経験者なら自分のラボでも試行錯誤しながら系をセットアップできるだろう。Methods in molecular biology: 1冊ごと読み切りでテーマが変わる。1980年代から2500冊近く発行されており、多様な手法がカバーされているJoVE: 実験プロトコルを動画も併用して伝えるという新しいコンセプトの雑誌。動画なので初めての手技もわかりやすい。 まず知っておきたいド定番のリソース PubMed: ライフサイエンス系の論文検索エンジンNCBI Genome Data Viewer: さまざまな生物種のゲノム情報を視覚的に検索UCSC Genome Browser: ゲノムや周辺情報の可視化ができるゲノムブラウザEnsembl Genome Browser: EMBLが提供する最新のゲノムブラウザNCBI BLAST: 塩基配列やアミノ酸配列からそれが何かを検索Sequence Read Archive (SRA): 次世代シークエンスデータのレポジトリーDigital Expression Explorer 2: SRAに公開されたRNA-seqデータの解析済みデータをダウンロードできるUniProt: タンパク質に関する統合データベースPDBj: タンパク質構造データの日本語ポータルサイトjPOST: プロテオームデータを閲覧・ダウンロードできるレポジトリーHOMCOS: タンパク質の結合立体構造検索 & モデリングReactome: パスウェイデータベース ブラウザで完結するRNA-seq解析ツール Galaxy: ブラウザで完結するRNA-seq解析ツール (他のバイオインフォ解析もできる)iDEP: ブラウザで完結するRNA-seq解析ツールBioJupies: ブラウザで完結するRNA-seq解析ツールRaNA-seq: ブラウザで完結するRNA-seq解析ツール エンリッチメント解析ツール David: 興味のある遺伝子セットに対するエンリッチメント解析を行うツールMetascape: Webで直感的に利用できるグラフィカルなエンリッチメント解析ツールEnrichr: 疾患や細胞株などさまざまな分野のデータベースに対してエンリッチメント解析が行えるツールWebCSEA: 細胞特異的な遺伝子発現エンリッチメント解析 COVID-19関連 COVID19db: SARS-CoV-2トランスクリプトームと創薬 CoV3D: コロナウイルスの実験的で解き明かされたタンパク質構造データベース DockCoV2: SARS-CoV2標的に対するインシリコ薬物ドッキングEnsembl COVID-19 resource : SARS-CoV-2の統合公開データ ESC: SARS-CoV-2免疫逃避バリアント LitCovid: NCBIが運営するCOVID-19のキュレーション文献データベースPAGER-COV: COVID-19に関連するパスウェイと遺伝子リストSCoV2-MD: SARS-CoV-2タンパク質のMD計算とバリアント解釈T-cell COVID-19 Atlas: SARS-CoV-2ペプチドとHLAアレルとの親和性の予測VarEPS: SARS-CoV-2バリアントや治療法 ゲノム関係 3′aQTL-atlas: ヒト正常組織における3′UTR alternative polyadenylation quantitative trait lociアトラス。3DGenBench: 3Dゲノミクスのための計算モデルのベンチマークAnimal-eRNAdb : 動物10種類のエンハンサー のデータベースASMdb: アリル特異的DNAメチル化データベース ChIP-Atlas: 公開ChIP-seqデータをブラウザで閲覧CircleBase: ヒト染色体外の環状DNACompoDynamics: ゲノム間の塩基配列の構成と特徴 CyanoOmicsDB: シアノバクテリアのゲノミクスとトランスクリプトミクスEVA: ヨーロッパのゲノムバリエーションのアーカイブEWAS Open Platform: EWAS (epigenome-wide association studies) 研究のための解析プラットフォームLIRBase: 真核生物における長い逆方向反復配列 Nucleome Data Bank: 3Dゲノム構造とシミュレーション miRNASNP: miRNA関連SNPsおよび変異MitImpact: ヒトミトコンドリアゲノム変異の計算済み病原性予測PheLiGe: 遺伝子型と表現型の関連性PhyloCloud: 系統樹のためのツールSomaMutDB: ヒト正常組織における体細胞突然変異 ゲノム編集関係 AcrDB: Anti-CRISPRオペロンデータベース AcrHub: Anti-CRISPRタンパクデータベースcrisprSQL: CRISPR/Cas9オフターゲットに関するデータベースCRISPR-view: CRISPRによる機能スクリーニングデータ 癌関係 CancerImmunityQTL: 複数のがん種の遺伝子と免疫療法間のQTL解析CancerMIRNome: TCGAや血中におけるmiRNAデータベースCancerSCEM: がんにおける1細胞レベルでの遺伝子発現データCellMinerCDB: 細胞株ベースのファーマコゲノミクスデータセットCTR-DB: がん患者由来の臨床トランスクリプトームと薬物反応lncRNAfunc: がんにおけるlncRNAの役割 GPEdit: がんにおけるA-to-I RNA編集OncoDB: がんにおける遺伝子発現とウイルス感染OncoVar: がんのドライバー変異、遺伝子、パスウェイOpen Targets Genetics: 遺伝子データから創薬標的の優先順位付けを行う Project Score: Sanger研究所が提供するCRISPR-Cas9スクリーニングによるがん依存性の特定SPENCER: がんにおいてnon-coding RNAにコードされるペプチドTISMO: マウスの腫瘍モデル 遺伝子発現制御 Bgee: 野生型の動物における遺伝子発現データをキュレーションしたもの cncRNAdb: コーディングRNAとノンコーディングRNAに関するデータベースGene Expression Nebulas: 生物種、バルク、単一細胞にまたがる発現プロファイル GRAND: ヒト組織、癌、細胞株、低分子薬剤から得られた遺伝子制御ネットワークコレクションmiTED: microRNA組織発現データベースTF-Marker: 特に細胞マーカーとして働くヒト転写因子 タンパク関係 AlphaFold Protein Structure Database: AlphaFoldで予測されたタンパク質構造DKK: あまり探求されていないkinaseのデータベースGproteinDb: Gタンパク質とその相互作用Human Proteoform Atlas : ヒトのproteoformのデータベースKincore: プロテインキナーゼの配列、構造、系統図FireProtDB: タンパク質の安定性データModelSEED Biochemistry: 生化学反応に関するデータベースSYNBIP: 合成された結合タンパク質 リスト タンパク質-核酸 ProNAB: タンパク質-核酸結合親和性データThe Protein–Nucleic Acid Thermodynamics Database (PNATDB): タンパクと核酸の実験的に得られた熱力学データを収録 疾患情報関係 Aging Atlas: 加齢に伴うオミックスデータをまとめたデータベースBrainBase: 脳疾患の知識データベースcircMine: 健康および疾患におけるヒトcircRNAのトランスクリプトームOlfactionBase: におい、におい物質、嗅覚受容体 Regeneration Roadmap: 細胞再生に関する文献とマルチオミックスデータ 患者データ シングルセル関係 DISCO: シングルセルオミクスの統合scEnhancer: ヒト・マウス・ハエの1細胞エンハンサーアノテーションscMethBank: シングルセルメチル化データ その他NGSデータ CSEA-DB: 細胞型別の遺伝形質データベース GeneLab: NASAが提供する宇宙生物学と電離放射線に関するオミックスデータ proCHiPdb: 原核生物のクロマチン免疫沈降データベースwebTWAS: TWASアトラス 薬関係 CeDR: scRNA-seqから見る健康・疾病における薬物応答 CovPDB: 共有結合の阻害剤とその複合体DDinter: 薬物-薬物相互作用DrugSpaceX: バーチャルスクリーニングのための1億化合物 NCATS Inxight: Drugs: 薬物の性質と調節 PK-DB: 臨床試験や前臨床試験で得られた薬物動態のデータ 生薬関係 CMNPD: 包括的な海洋天然物データベースNPAtlas: 天然化合物アトラスNPCDR: 医薬品と天然物の組み合わせと疾患 NP-MRD: 天然物の磁気共鳴データベース 免疫関係 INDI: ナノボディをさまざまなデータリソースから自動収集SPICA: 免疫細胞解析のためのポータルサイト 微生物関係 AMDB: 動物のマイクロバイオームデータベースARTS-DB: 抗生物質耐性ターゲットデータベースBastionHub: グラム陰性菌の分泌システムの基質データベースBiG-FAM: 生合成遺伝子クラスター・ファミリーに関するデータベースmBodyMap: 健康と病気における人体の微生物分布 MVIP: 様々な生物種のウイルス感染下でのマルチオミクスデータNMDC Data Portal: 微生物のマルチオミクスデータポータルPeryton: 微生物と疾病の関連性VEuPathDB: 真核生物の病原体、ベクター、宿主の関係 ViMIC: ウイルスの変異やゲノムへのintegration部位、シス効果ViroidDB: ウイロイドデータベースVThunter: scRNA-seqによる動物間でのウイルス受容体発現解析 ZOVER: 人獣共通感染症とそのベクターやウイルス 植物関係 AtMAD: シロイヌナズナの マルチオミクス関連データベースCyanorak: シアノバクテリアの比較ゲノム解析PCMDB: 植物の細胞マーカーデータベースPlantGSAD: 植物の遺伝子セットアノテーションqPTMplants: 植物における翻訳後修飾Echinoderm genomics: 棘皮動物ゲノム解析 各種メーカー ベクタービルダー: デザインしたベクターを作成してくれる会社