NCBI(美国国家生物技术信息中心)是美国国立卫生研究院(NIH)下属的国家医学图书馆(NLM)的一个部门,它提供了一系列广泛的生物信息数据库和工具,支撑着全球范围内的生物医学研究、教育和临床实践。NCBI的数据库和工具都是免费向全球用户开放的,这极大地促进了科学知识的传播和应用。它主要包括:
-
NCBI Gene数据库是一个综合性的资源,它汇集了全球的基因信息,包括基因的序列、功能、表达、变异以及与其他生物分子的相互作用等详细数据,为生物学研究提供了基础性的基因数据支持。
-
GenBank是一个公共核酸序列数据库,它收集并注释了来自全球研究者的DNA、RNA序列数据。作为国际核酸序列数据库合作组织(INSDC)的一部分,确保了数据的广泛共享和快速更新,为生命科学研究提供了基础资源。
-
PubMed包含了超过3200万篇文献,支持用户通过关键词、作者名或期刊名称等多种方式快速检索到所需资料,为科研人员、医疗专业人士及学生提供了对生物医学和生命科学领域内大量文献摘要及部分全文的访问。PubMed是进行医学及相关领域研究时不可或缺的信息来源。
-
SNP是由NCBI维护的公共数据库,它收集并提供了关于单核苷酸多态性(SNP)的广泛信息,包括SNP的位置、变异类型以及在不同人群中的分布频率等,是研究遗传变异不可或缺的工具。
-
OMIM是一个权威的在线资源,提供了人类遗传病和基因的详细信息,支持疾病研究和临床诊断。通过OMIM,用户可以快速访问特定疾病的基因关联、临床特征及最新研究成果。
-
ClinVar是一个公开访问的数据库,专注于收集和分享有关人类基因变异及其与健康影响的信息。它不仅为研究人员提供了丰富的变异数据资源,还支持临床诊断,帮助识别致病变异1。通过整合多种来源的数据,ClinVar促进了对遗传变异的理解和应用,是医学遗传学研究的重要工具。
-
Structure数据库提供了生物大分子的三维结构数据,这些数据来源于 Protein Data Bank (PDB),并通过Entrez系统提供搜索和分析。它支持研究人员探索分子结构与功能的关系,并包含可视化工具便于直接查看复杂三维结构。
-
Protein数据库是一个综合性的资源,提供了来自多种来源的蛋白质序列信息,包括注释详情如功能描述、结构域信息和相似序列等。它支持科学家进行蛋白质的功能预测、进化分析以及疾病关联研究。
-
Nucleotide数据库是一个收录了各种生物物种的DNA和RNA序列的公共资源。它允许用户搜索、下载以及分析核苷酸序列数据,并提供了丰富的注释信息,支持生命科学研究。
-
Assembly数据库提供了有关基因组组装的信息,包括了从简单到复杂的各种生物体的完整基因组序列。它不仅包含了基因组组装的结构信息,还提供了装配名称、元数据、统计报告以及与基因组序列数据的链接。
-
SRA旨在存储和提供高通量测序数据的开放访问,支持基因组学、转录组学等多个研究领域。它不仅促进了全球科研人员之间的数据共享,也为进一步的数据分析与挖掘提供了宝贵资源。
-
GEO (Gene Expression Omnibus) DataSets提供了一个存储和检索基因表达数据的平台。它包含了来自全球研究者的高通量基因表达实验数据,支持对这些数据进行公开访问和分析。
-
GTR由美国国立生物技术信息中心(NCBI)维护,提供了一个全面的基因测试信息数据库。它旨在帮助研究人员、医疗保健提供商和公众了解现有的基因测试及其用途,包括临床和研究应用。
-
Variation Viewer是由NCBI提供的可视化工具,用于浏览人类基因组中的变异信息。它整合了多种数据来源,支持对单核苷酸多态性(SNPs)、结构变异等遗传变异进行查询和分析。该工具为研究人员提供了直观的界面,便于探索基因变异与表型及疾病之间的关系。
-
BLAST是由NCBI开发的一种用于比较生物序列的工具,广泛应用于分子生物学领域以寻找序列之间的同源性。它通过快速搜索核酸或蛋白质数据库,能够有效地识别与查询序列相似的序列,是基因组数据分析中不可或缺的工具。
-
UniProt是全面、高质量的蛋白质序列与功能注释数据库。它整合了来自多个来源的蛋白质数据,包括序列、结构、功能域及翻译后修饰等信息。该数据库广泛应用于蛋白质组学、分子生物学和生物信息学研究中。
-
The Human Protein Atlas是一个基于公开数据和实验生成的资源,提供对人体蛋白质编码基因及其表达产物的全面注释。该数据库整合了转录组、蛋白质组和抗体影像数据,支持对人类蛋白质在不同组织和亚细胞结构中的表达进行可视化分析。