一文快速读懂kegg数据库与通路图(代码片段)

修罗神天道 修罗神天道     2022-12-09     203

关键词:

一、介绍

在进行生物学实验或者生物信息的学习中,都会听说KEGG富集分析,而且该方法在高通量测序分析中已然成为数据分析中必不可少的一环。

这种分析方法依托的是由 Kanehisa实验室 在1995年开发的KEGG数据库,全称为 Kyoto Encyclopedia of Genes and Genomes(京都基因与基因组百科全书)。它拥有多个子数据库,包含基因组,生化反应,生化物质,疾病与药物,以及最常用PATHWAY通路信息。

接下来进入KEGG官网:https://www.kegg.jp ,它的主页主要由以下几部分构成:

二、KEGG的数据库构成

KEGG子库中存储的信息是生物系统的计算机表示形式,由基因和蛋白质(基因组信息)和化学物质(化学信息)的分子部件组成,这些部件的相互作用,反应和关系构成调控网络图(系统信息),除此之外,还包含疾病和药物信息(健康信息)。具体的分类及数据库如下:

三、KEGG PATHWAY 数据库

在所有子数据库中最重要也是最常用的就是KEGG PATHWAY,它包括大量由科研人员根据已有研究文献,通过手动绘制的KEGG通路图,代表着代谢过程,环境信息过程,细胞过程,生物系统,人类疾病和药物开发。

每个通路都由一个五位数字标识,后跟以下任意一个:map,ko,ec,rn和三字母或四字母生物代码,它们分别代表五种通路类型:

  • map编号:代表reference pathway,根据已有的知识绘制的、概括的、详尽的具有一般参考意义的代谢图。 一个点同时表示一个基因,这个基因编码的酶或这个酶参加的反应
  • org编号:物种特异性通路,这里就是将K编号基因(直系同源基因,后面会介绍)换为每个物种中对应的基因
  • ko编号:KO通路中的点表示直系同源基因
  • ec编号:EC通路中的点表示相关的酶
  • rn编号:化学反应通路中的点只表示该点参与的某个反应、反应物及反应类型

在了解每种通路之前我们先学会在KEGG中切换每种通路类型

地址:https://www.kegg.jp/kegg-bin/show_pathway?org_name=map&mapno=00020&mapscale=&show_description=hide

使用过程中切换各种通路类型,比如进入TCA循环 ,可以通过左上角下路菜单来切换:

接下来,我们详细介绍每种通路:

1. 参考通路图 (map)

这里以 TCA循环 的通路图为例,进入参考通路图(Reference pathway)。这是原始版本的通路,也是后续几种通路图的"模板"。每个白框可以代表直系同源基因,酶,反应,也可以点击链接至KO,ENZYME和REACTION详细信息。

上述的形状,箭头,线段代表如下意义:

2. 物种特异性通路 (org)

我们选择人的物种名Homo sapiens (human),点击Go。可以看到与Reference pathway 图(map00020)不同的是有物种特异性基因被标注为绿色,而且通路编号为hsa00020

访问链接: https://www.kegg.jp/kegg-bin/show_pathway?org_name=hsa&mapno=00020&mapscale=&show_description=hide 
当然,如果直接访问 hsa00020的链接也可以进入该通路: https://www.kegg.jp/kegg-bin/show_pathway?hsa00020 

点击绿色基因,会进入Gene详细信息

3. 直系同源物通路 (ko)

蓝色框超链接到从原始版本中选择的KO条目

进入PCK的直系同源基因信息

4. 酶通路 (ec)

蓝色框超链接到从原始版本中选择的ENZYME条目

进入ENZYME

5. 反应通路 (reaction)

蓝色框超链接到从原始版本中选择的反应条目,

点击后进入对应的反应信息界面,如下图

四、KEGG ORTHOLOGY(KO)数据库

KEGG ORTHOLOGY (KO)数据库是构建Pathway和Module的基础,相当于KEGG数据库构建的基石,因此理解KO数据库的构成对于使用及了解KEGG至关重要。

然而,这种通用方法不足以理解由物种内基因和基因组的变异所引起的更详细的特征,特别是对于理解与人类基因和基因组的疾病相关的变异而言。后来他们开发了  KEGG NETKERK,该数据库不仅涉及基因变异,而且包括病毒和其他因素的网络变异方面的疾病和药物知识。 

KEGG的开发者根据不同生物之间基因和基因组的保守和变异,引入直系同源物(KO)的概念,使得KEGG通路图,BRITE层次结构和KEGG模块的参考数据集可以广泛应用于任何细胞生物。

概念

1.KO号:表示不分物种的通路,相当于所有物种的这一通路的并集,比如ko00020代表的 TCA 循环 (下图所示),下图的每个圆角矩形也代表着一个KO通路。

2.K号:表示基因,每个号代表的是所有物种的一个同源基因,比如上图中的K01596代表的是 PCK

进入K01596的详细页面,我们会看到它代表的是一个基因列表,这些基因具有一个功能却来自于不同的物种。

3.C号:表示化合物

有基因id或者基因名,如何拿到对应的kegg通路图?

1、https://www.kegg.jp/kegg/tool/map_pathway2.html 2、如下图,筛选出基因所在的通路,并标上不同的颜色。 3、结果页面如下,有些基因会找不到对应的通路,如下图红字,找到通路的会列在下方,点击可以查看对应通路。  查看详情

求助大神kegg信号通路图怎么看

参考技术A这个很简单的,什么不明白的,可以一步一步交你,本人作五年了, 查看详情

r语言可视化通路富集网络图

...法。在KEGGPATHWAYDatabase查询,例如查询小鼠的"CellCycle"这条通路:得到通路ID为"04110",物种为"mmu"我们通过指定gene.data和pathway.id来观察我们数据里的基因在信号通路“Pathwaysincancer”上的表达变化:相比于原始的KEGG图,我们可以使用graphv... 查看详情

rabbitmq一文读懂(代码片段)

目录1、RabbitMQ介绍应用场景其他消息队列选择RabbitMQ原因2、AMQP消息队列其他相关知识什么是AMQP?什么是JMS?3、RabbitMQ快速入门RabbitMQ的工作原理RabbitMQ消息发送和接受流程梳理RabbitMQ消息发送RabbitMQ消息接受RabbitMQ安装Rabbi... 查看详情

drools规则引擎一文读懂(代码片段)

目录一、Drools简介电商平台的促销活动规则引擎Drools简介二、Drools快速入门 电商平台促销积分规则开发实现三、Drools规则引擎构成及其核心类Drools规则引擎构成Drools规则引擎概念四、Drools基础语法规则文件构成 规则体语法结... 查看详情

一文读懂golanginit函数执行顺序(代码片段)

...数,主要用于完成程序的初始化工作,如初始化数据库的连接、载入本地配置文 查看详情

一文读懂zookeeper--万字长文肝就完了(代码片段)

1.zookeeper在分布式集群的作用1.1,数据发布与订阅(配置中心)发布与订阅模型,即所谓的配置中心,顾名思义就是讲发布者将数据发布到zk节点上,共订阅者动态获取数据,实现配置的集中式管理和动... 查看详情

一文读懂yolov5与yolov4(代码片段)

YOLO之父JosephRedmon在今年年初宣布退出计算机视觉的研究的时候,很多人都以为目标检测神器YOLO系列就此终结。然而在4月23日,继任者YOLOV4却悄无声息地来了。AlexeyBochkovskiy发表了一篇名为YOLOV4:OptimalSpeedandAccuracyofObjectDetec... 查看详情

go/kegg功能富集分析及气泡图

...功能进行分类的问题,科学家们开发了很多基因功能注释数据库,。这其中比较有名的一个就是GeneOntology(基因本体论,GO)和KyotoEncyclopediaofGenesandGenomes(京都基因与基因组百科全书,KEGG)。其中,GO是基因本体论联合会建立的... 查看详情

一文读懂浏览器存储与缓存机制!(代码片段)

浏览器存储CookieCookie是HTTP协议的一种无状态协议。当请求服务器时,HTTP请求都需要携带Cookie,用来验证用户身份。Cookie由服务端生成,存储在客户端,用来维持状态。通常Cookie由以下值构成:名称(name&#x... 查看详情

一文读懂web安全(代码片段)

Web安全是互联网中不可或缺的一个领域,这个领域中诞生了大量的黑帽子与白帽子,他们都是安全领域的王者,在平时里,他们利用各种巧妙的技术互相博弈,时不时就会掀起一场Web安全浪潮,真可谓神仙打架,各显神通。本文... 查看详情

怎样在kegg查找萜类化合为合成通路

...术A何利用KEGG定位基属于哪代谢通路代谢通路:目前通路数据库(PATHWAYdatabase)代谢通路建立约90参考代谢途径图形每参考代谢途径由酶或EC号组网络利用通计算机构建物体特代谢通路:先根据基序列相似性位置相关性确定基组酶基... 查看详情

nlp一文读懂命名实体识别(代码片段)

一文读懂命名实体识别前言定义发展历史常见方法相关数据集工具推荐Reference前言本文对自然语言基础技术之命名实体识别进行了相对全面的简绍,包括定义、发展历史、常见方法、以及相关数据集,最后推荐一大波python实战利... 查看详情

xxl-job一文读懂(代码片段)

....2Xxl-job优点3、Xxl-job实战3.1、Xxl-job安装3.1.1下载源码 3.1.2数据库初始化3.1.3XXL-JOB数据库说明3.1.4XXL-JOB项目介绍 3 查看详情

快捷查找kegg里的通路和基因

参考技术A1.快捷查找ID对应的description,知道通路对应的编号是多少。2.找出某一个/几个通路里的全部基因,用来做单独的下游分析。如果是要做KEGG的富集分析,clusterProfiler可以搞定:https://bioconductor.org/packages/release/bioc/vignettes/c... 查看详情

kafka一文读懂(代码片段)

第一、Kafka简介    Kafka是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域。消息队列应用场景消息队列优点解耦可恢复性缓冲灵活性&峰值处理能力异步通信消息队列... 查看详情

一文读懂.net中的高性能队列channel(代码片段)

介绍System.Threading.Channels是.NETCore3.0后推出的新的集合类型,具有异步API,高性能,线程安全等特点,它可以用来做消息队列,进行数据的生产和消费,公开的 Writer 和 Reader api对应消息的生产者和消费者,也让Channel... 查看详情

一文读懂redis的zset(代码片段)

zset的数据结构在redis中有一个有序列表,它的底层是由压缩列表或跳表组成。我们看下对应的数据结构压缩链表:跳表:下载下来4.0的源码https://download.redis.io/releases/redis-4.0.0.tar.gz对应的源码:src/server.h#最大层级#... 查看详情