蛋白质数据库一级结构

蛋白质数据库一级结构在生物化学上定义1级结构为蛋白质分子中氨基酸残基的排列顺序

1级结构中的氨基酸是蛋白质最基本的结构单位,标准的氨基酸有20多种,在1个氨基酸中含有氨基—NH2和羧基—COOH,若氨基中失去1个H原子,羧基中失去OH基团,就形成了残基

2个氨基酸可以脱水缩和成肽,形成肽键和稳定的肽平面

相邻2个氨基酸残基以肽键相连接,依次连接下去即构成了1级结构肽链

在PDB入口文件中,蛋白质1级结构部分主要描述生物大分子每条链中氨基酸的排列顺序

该部分包含有DBREF、SEQADV、SEQRES、MODRES等4种记录,其中SEQRES记录对氨基酸残基有序排列进行了描述

例如,在1ROG(组织相容性抗原HLA-B*2705)入口文件中共有16条SEQRES记录,分为A、B2个链,每行为1条记录,按排列顺序列出氨基酸残基,一行一行连贯下去,就组成了由GLY、SER、HIS,……氨基酸残基顺序连接而成的肽链

下例是由1ROG.pdb文件中摘录的部分内容:SEQRES 1 A 183 G LY SER HIS SER M ET A RG T Y R PHE HIS TH R SER VA L SER 1ROG 73SEQRES 2 A 183 A RG P RO G LY A RG G LY G L U PRO A RG PHE IL E T HR VA L G LY 1ROG 74SEQRES 3 A 183 T Y R VA L ASP ASP T HR L EU PHE VA L A RG PHE ASP SER ASP 1ROG 75… … … … …SEQRES 14 A 183 A RG T YR LEU G L U A SN G L Y L YS G L U T HR L EU G LN A RG A LA 1ROG 86SEQRES 15 A 183 N M E 1ROG 87SEQRES 1 B 9 A RG A RG I LE LYS A LA IL E T HR L EU L YS 1ROG 88如前所述,每行是1条记录,每行中第1个字段是记录名“SEQRES”

第2个字段是1个整数,表示记录在当前链中的序号

第3个字段是链的标识符,本例有A和B2个链,如果仅有1个链,则该字段域为空

第4个字段是1个整数,表示本链中氨基酸残基数

第5~17字段是氨基酸残基序列,每个字段是1个氨基酸名字

以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。

相关