基因组信息学全基因组分析

基因组信息学全基因组分析基因组全序列分析的第一步工作之一就是寻找基因组序列中的可翻译部分,即开放阅读框(ORF)

现有的方法之一是利用DNA序列上的转录和调节信号作为开放阅读框的识别标记

另一种方法是寻找与已表达序列标志(EST)具有相似性的核苷酸片段

对于真核生物的基因组,为了正确区分外显子和内含子,需与已有的cDNA序列数据进行比较,才能推算出相应的氨基酸序列

基因组序列的初步鉴定完成后,进一步的工作就是比较不同物种间基因组,基因组的比较已在原核生物、古细菌和至少一种真核生物之间进行,主要比较基因的功能和基因在染色体上的定位

对代谢途径的比较分析可导致代谢方面的新发现,也可对已知途径进行补充和修改

比较病原菌与非病原菌的基因组可发现新的病原性基因

比较在原核生物、古细菌和真核生物中都存在的蛋白质家族可发现具有高度保守序列的古蛋白

这些古蛋白很可能在进化早期阶段的简单有机体中扮演重要角色

随着基因组序列测定技术的发展,人类将在短时间内获得大量的基因组序列数据

因此序列分析技术面临的另一个问题就是如何以更快的速度和更高的自动化程度处理大量的基因组数据

1994年出现的GeneQuiz就是一种专为大规模序列分析而编写的软件系统,并且经过改进,已发展成一套可以多种自动化水平运作的分析软件

另外欧洲生物信息学研究所(EBI)的SRS系统和美国国家生物技术信息中心(MCBI)的Entrez也是性能优良的序列分析软件

以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。

相关