KEGG Module 数据库的原理是什么

蜗牛vps 互联网技术资讯 2021-12-02 282 0

KEGG Module 数据库的原理是什么,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

具有相同功能的基因被归类到kegg orthology 中,每个KO 代表具体的一个功能。在生命活动中,往往需要多个功能单位共同发挥作用,比如多个蛋白质构成复合体来发挥调控作用,此时多个KO就整合在了一起。这个例子说明在KO 之上,必然还存在一个分类系统,将参与同一过程的多个KO划分在一起。实际上,KEGG Module 数据库就是存储这种信息的数据库。

KEGG Module 数据库中的每条记录代表一个功能单元,是多个KO的集合,叫做kegg  module, 通过大写字母M和数字进行标识;

module 数据库包含以下4大类别的功能:

  1. pathway modules

  2. structural complexes

  3. functional sets

  4. signature modules

更加详细的分类信息可以在brite 数据库中找到,见以下链接

http://www.kegg.jp/kegg-bin/get_htext?ko00002.keg

和pathway 类似,对于每条module 的记录,都有一张对应的图片,叫做module  map

M0002对应的map 如下图

KEGG Module 数据库的原理是什么  module 第1张

结合其详细信息,我们来理解下module 的构成

KEGG Module 数据库的原理是什么  module 第2张

从Definition 字段的信息,我们可以看到每个Module 有多个KO 构成,那么这些KO 之间有什么样的关系呢,这就要从definition 字段的定义说起!

被空白分隔的每个字段叫做1个block, M0002 可以分成以下5个主要的block

  • K01803

  • ((K00134,K00150) K00927,K11389)

  • (K01834,K15633,K15634,K15635)

  • K01689

  • (K00873,K12406)

在这里,空格代表的是逻辑与 AND 的关系,表示这5个block 一起发挥作用;
(K01834,K15633,K15634,K15635) block 中,逗号代表逻辑或OR的关系,任何一个KO都可以起到这个blcok的作用。

注意在 ((K00134,K00150) K00927,K11389) 中同时出现了逗号和空格,为了正确区分,还使用了圆括号。圆括号内为1个block, 所以K00134,K00150 为1个block, 这个block 和 K00927 用空白分隔,所以是AND关系,而逗号连接的是(K00134,K00150) K00927K11389 两个block。 所以这个block对应的map 就是上图展示的那样。理解了definition 字段的信息,不难发现根据该字段的信息,可以计算出这个module 对应的map。

除了空格和逗号之外,definition 还会出现 +, - 。比如((K01878+K01879),K14164,K01880), 加号代表两个KO一起作为一个block发挥作用,对应的map 图为
KEGG Module 数据库的原理是什么  module 第3张
减号代表可选项的意思,表示这个block可有可无。比如K01866 K01873 -K07587 -K11627 -K01884。减号连接的block 虽然可有可无,但是在map图中还是会出现的。

由于module 由KO 发展而来,所以module 也是跨物种的概念。对于每个物种而言,也有该物种对应的module, 比如M0000 在human中对应的记录为hsa_M00002;

在物种的module 中,根据包含的block的个数,可以划分成两类

  1. complete  module, 包含reference module 中所有的block;

  2. incomplete module , 只缺少了1个或者2个block;

在物种对应的module map 中,会对该物种对应的KO高亮显示
KEGG Module 数据库的原理是什么  module 第4张

总结

  1. KEGG Module 数据库是对KO的整合,每个module 代表1个功能单元,是多个KO的集合;

  2. Module 由block 构成,definition 字段的信息需要理解空格,逗号,加号,减号的不同含义,根据definition 字段的信息可以计算得到module map;
    3.module 是跨物种的概念,最原始的叫做reference module, 定义了block的数量; 物种对应的module 根据包含的block的完整性,可以分为complete module 和 incomplete module; 在物种对应的module map 中,对应的KO会高亮显示

关于KEGG Module 数据库的原理是什么问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注蜗牛博客行业资讯频道了解更多相关知识。

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:niceseo99@gmail.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

评论

有免费节点资源,我们会通知你!加入纸飞机订阅群

×
天气预报查看日历分享网页手机扫码留言评论Telegram