11 富集分析[Enrichment Analysis]

本章节的分析目的是:推断样本间差异表达基因所代表的的生物学意义。经过前述分析过程,得到了组间的差异表达基因,以及基因的功能注释。富集分析能够对这些差异表达基因的注释信息进行概括。常用的富集分析包括GO富集分析和KEGG富集分析。

11.1 GO富集分析

GO富集分析是对一组基因的GO功能注释进行概括。GO,即基因本体论(Gene Ontology),是一套标准化的基因注释体系,包括一组对基因和蛋白质功能进行限定和描述的术语。GO包括三个部分:

  • 细胞组分 (Cellular Component,CC),基因产物所在的位置、亚细胞结构、大分子复合物,如核仁、端粒和泛素蛋白酶复合物等。
  • 分子功能 (Molecular Function,MF),基因产物的生化活性和功能,如与碳水化合物或ATP水解酶活性等。
  • 生物过程 (biological process,BP),基因产物参与的生物过程,如有丝分裂和嘌呤代谢等.

11.1.1 green_vs_yellow

In thie analysis of green_vs_yellow, we got58 terms

11.2 KEGG通路富集分析

KEGG是一个整合了高级功能和生物系统(如细胞、 生物和生态系统),从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源。

The KEGG is a database resource for understanding high-level functions and utilities of the biological system, such as the cell, the organism and the ecosystem, from molecular-level information, especially large-scale molecular datasets generated by genome sequencing and other high-throughput experimental technologies.

11.2.1 green_vs_yellow

In thie analysis of green_vs_yellow, we got0 terms