在生物信息学研究中,高效利用数据库是提升研究效率的关键。本文整理了 4 类常用的生信数据库,涵盖公共数据、转录调控、植物研究及医学研究领域,包含各数据库的核心功能、网址及实用操作技巧,适合新手快速上手。
一、常用公共生信数据库
1. GSA 数据库
GSA 数据库被誉为我国自己的 “NCBI”,主要用于存储组学原始数据,功能类似 NCBI 的 SRA 数据库。
主要优势:基于国内服务器,数据上传和下载的网速更快,沟通便捷,必要时还支持硬盘寄送服务,极大方便了数据传输。
官方网址:CNCB - Home
实用操作提示:可直接进行原始数据的提交与下载,查询公开信息也十分便捷,相比使用国外数据库能节省大量操作时间。
2. SRA 数据库
SRA 数据库是挖掘已发表测序数据、练习数据分析技能的重要工具。
核心作用:作为 NCBI 旗下的 “数据仓库”,存储了大量已发布的高通量测序数据。
官方网址:https://www.ncbi.nlm.nih.gov/sra
实用操作提示:通过关键词搜索可快速找到目标数据,既能直接下载用于练习分析,也能进行深入的数据挖掘,是生信新手必须掌握的数据库之一。
3. GEO 数据库
GEO 数据库是基因表达数据的重要资源库,涵盖芯片和测序的基因表达谱数据。
核心作用:用于存储基因表达数据,支持用户上传自有数据,也可下载他人数据进行二次分析。
官方网址:https://www.ncbi.nlm.nih.gov/geo/
实用操作提示:首页提供详细教程和工具,可查询数据集(目前已超 17 万个)和样本(500 多万个),查找数据时建议从 “Dataset” 入口进入。
4. KEGG pathway 数据库
KEGG pathway 数据库是通路分析的常用工具,能清晰梳理从基因到分子网络的关联。
核心作用:存储代谢通路、调控通路图,助力基因功能的系统分析。
官方网址:KEGG: Kyoto Encyclopedia of Genes and Genomes
实用操作提示:通过搜索通路名或基因,可直接查看通路图,图中清晰标注了上下游关系,便于理解基因间的相互作用。
5. Wiki pathway 数据库
Wiki pathway 数据库是查找通路图的另一优质选择,相比 KEGG 更为灵活,关键词搜索功能便捷。
核心作用:提供多种物种的通路图查询,涵盖细胞凋亡、信号通路等多种类型。
官方网址:https://www.wikipathways.org/
实用操作提示:在首页直接搜索关键词(如 “细胞凋亡”),可下载通路图,适用于 PPT 制作等场景。
6. Gene 数据库
Gene 数据库在查询基因基本信息方面具有优势,相比仅针对人类基因的工具,其覆盖物种更广泛。
核心作用:提供不同物种的基因功能、位置及相关文献等信息。
官方网址: