GO(Gene Ontology)是基因本体联合会(Gene Ontology Consortium)所建立的数据库,旨在建立一个适用于各种物种的,对基因和蛋白功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准,适用于各物种。通过建立一套具有动态形式的控制字集(controlled vocabulary),来描述基因及蛋白质在细胞内所扮演的角色,从而来全面描述生物体中基因和基因产物的属性。GO数据库总共有三大类,分别是生物学过程(Biological Process, BP)、细胞定位(Cellular Component, CC)和分子功能(Molecular Function, MF),各自描述了基因产物可能行使的分子功能,所处的细胞环境,以及参与的生物学过程。GO数据库中一个基本的概念是节点,每个节点都有一个名称,比如“Cell”、“Fibroblast Growth Factor Receptor Binding”或者“Signal Transduction”,同时有一个唯一的编号,如“GO:nnnnnnn”。基于鉴定到的蛋白ID,采用mapping的方式从Uniprot数据库中得到蛋白质的GO数据库注释信息,对蛋白质进行功能分类注释。针对BP、CC和MF中所涉及的GO节点,列出所有相应蛋白质个数,同时分别对表达蛋白的二级分类情况做出统计图。
1. GO二级分类统计图
图1 差异表达蛋白的GO二级注释
注:横坐标为GO分类,纵坐标左边为蛋白数目所占百分比,右边为蛋白数目。此图展示的是在差异表达上调蛋白和下调蛋白GO各二级功能的蛋白富集情况,体现两个调节方向下各二级功能的地位,具有明显比例差异的二级功能说明差异表达上调蛋白与下调蛋白的富集趋势不同,可以重点分析此功能是否与差异相关。
2. GO levels分类统计图
根据不同levels中GO节点注释到的蛋白数量,选择排名前20个GO节点进行展示,如图所示:
图2 蛋白质在不同level中的注释结果统计图
注:横坐标是富集到蛋白的百分比,纵坐标是按层级从小到大排列。不同level用不同的颜色显示,每个柱子后面的数字是该分类中的蛋白数量。
3. topGO蛋白质富集分析
百泰派克采用topGO对差异表达蛋白进行富集分析,可以得到差异表达蛋白在GO节点中的富集显著性。并对显著富集的节点在GO体系中的层级关系以有向无环图的形式进行直观展示。topGO有向无环图能直观展示差异表达基因富集的GO节点(Term)及其层级关系,是差异表达基因GO富集分析的结果图形化展示,分支代表包含关系,从上至下所定义的功能描述范围越来越具体。在有向无环图中,箭头代表包含关系,即该节点的所有基因同样注释到其上级节点中。
差异表达蛋白的topGO分子功能有向无环图如下:
图3 差异表达蛋白topGO富集有向无环图(分子功能)
注:对每个GO节点进行富集,在图中用方框表示显著度高的10个节点,图中还包含其各层对应关系。每个方框(或椭圆)内给出了该GO节点的内容描述和富集显著性值。不同颜色代表不同的富集显著性,颜色越深,显著性越高。
百泰派克生物科技-生物制品表征,生物质谱多组学优质服务商
北京百泰派克生物科技有限公司(Beijing Bio-Tech Pack Technology Company Ltd.简称BTP)从事以生物质谱为依托的生物制品表征,大分子物质(包括蛋白质、多肽、代谢物)质谱分析以及小分子物质检测服务。
1、公司采用ISO9001质量控制体系,专业提供以质谱为基础的CRO检划分析服务;
2、获国家CNAS实验室认可,为客户提供符合全球药政法规的药物物质量研究服务;
3、业务范围要盖蛋白质组学、多肽组学、代谢组学、生物药物表征、单细胞分析、单细胞质谱流式、生信
云分析以及多组学生物质谱整合分析等;
4、七大质量控制检测平台,满足您一站式服务需求,
5、服务3000+企业,10000+客户的选择