蛋白质组研究蛋白质组学存在于细胞核里的DNA构成了基因组
基因组作为遗传信息的载体,最根本的特征就是稳定不变
对单细胞生物而言,不论在什么样的生长条件下,其基因组始终保持不变

对多细胞生物来说,每一个个体的基因组,在构成个体的不同种类的细胞里都是一样的,知道了个体内某一细胞内的基因组就知道了该个体所有细胞的基因组
然而对于蛋白质组而言,由于蛋白质是生命活动的主要执行者,不同类型的细胞或同一个细胞在不同的活动状态下,其蛋白质组的蛋白质种类构成却是很不一样的
所以,蛋白质组与基因组的一个重要差别就是蛋白质组具有多样性
这种差别要求我们对“蛋白质组”的概念要进行仔细的分析
目前蛋白质组比较公认的定义是:一个基因组内所有基因表达的全部蛋白质
这种定义从字面上容易理解,但在实际中却很成问题
任何一种生物的基因组,都是由不编码蛋白质的核苷酸序列和编码蛋白质的核苷酸序列(基因)所组成
基因通常只是基因组的一小部分,例如编码人类蛋白质的核苷酸序列大约占人类基因组的2%
要想从混杂有大量非编码核苷酸序列的基因组中找出基因,如同沙里淘金
基因组研究的结果表明,一个基因组拥有的“基因”数目是由两部分组成的:通过实验证明确有蛋白质产物的真实基因、根据起始密码和终止密码序列所确定的潜在基因
生物学家们把这两类基因都称为“开放阅读框”(open reading frame,ORF)
因此,一个基因组内的基因数目通常是指ORF的数目
当一个基因组的全序列测定之后,确定其含有的ORF就成为了主要任务,称为基因注释
目前用于基因注释的方法还有较高的出错率,尤其对于那些存在不连续基因(即在一个基因内插有非编码的核苷酸序列)的复杂基因组,出错的问题更为突出
此外,这些ORF是否与蛋白质存在一一对应关系也是一个问题
一方面,人们已经发现有许多“假基因”(pseudogene)的存在,这些假基因有和真基因相同的ORF,但却从不表达
另一方面,由于存在RNA水平上遗传信息的加工——mRNA(RNA editing),以及蛋白质水平上遗传信息的加工——蛋白质剪接(protein splicing),许多蛋白质很难找到直接对应的ORF
如果我们不能确定基因组的“所有”基因,我们从何知道蛋白质组的“全部”蛋白质?显然,确定基因数目最可靠的方法是通过研究蛋白质组来进行
据最新统计,人类基因组拥有的基因数目大约是在3万到4万个之间
如果能够把人体252种细胞内的全部蛋白质都给鉴定出来,那么我们就有可能真正知道人类基因组的所有基因
但是这样一来,基因组和蛋白质组形成了“循环定义”:蛋白质组是以基因组拥有的所有基因的表达产物来构成,而所有基因的确定又必须通过蛋白质组来给予肯定
蛋白质组学的研究技术目前还有很多不完善之处,许多新技术正在研发之中
因此,蛋白质组学的发展是受技术限制的,也是受技术推动的
如果说未知世界是一个无边无际的海洋,那么我们的知识就是这海洋里一个小小的岛屿
随着科学的进步,知识的岛屿会不断地扩张
但我们同时会发现,环绕着知识岛的未知领域也在增长
我们的研究可以逐渐地扩大人类知识的领地,但永远不能穷尽宇宙的奥秘
基因组也好,蛋白质组也好,都不会是人类认识生命的终点
以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。