种植技术
首页 > 种植技术 > 浏览文章

生物信息学及其在农作物基因工程中的应用

(编辑:admin 日期:2014年09月20日 浏览: 加入收藏 )
 

  20世纪80年代末,人类基因组计划(Human Genome Project,HGP)的启动推动了生物信息学的产生和蓬勃发展。而2002年和2009年相继完成的水稻和高粱基因组测序,则宣告了相对低迷的农作物基因工程的一个繁荣的信息时代的到来。生物信息学已经成为生物学实验的一种有力的辅助工具,在科学研究中发挥着无比卓越的作用。随着植物基因组计划和功能基因组学的发展,生物信息学将为世界粮食作物的基础和应用性研究提供宝贵的数据化信息,其在农作物基因工程研究中必将发挥出更加巨大的作用。因此,有效地将生物信息学应用于农作物基因工程的研究是一项极有意义的工作。

1生物信息学

1.1生物信息学概述20世纪末,互联网的日益普及和生命科学的蓬勃兴起孕育了一门崭新的学科——生物信息学。生物信息学以生物大分子数据库中核酸、蛋白质为主要研究对象,综合运用数学、计算机科学和生物学多种工具对其进行存储、管理、注释、加工,使之成为具有明确生物学意的信息,同时通过对生物信息的查询、搜索、比较、分析,从中获取基因编码、基因调控、核酸和蛋白质结构功能及其相互关系等知识。目前,生物信息学已经成为生物科学家一种必不可少的工具。这门学科在农作物研究中也有着非常广泛的应用。拟南芥、水稻等模式植物的全基因组测序工作完成之后,其序列图谱完全可以在基因组数据库中查询。玉米、棉花等农作物的基因组数据库也正在构建之中。在功能基因组研究方面,有关农作物生长发育、细胞信号和基因调控的网络资源层出不穷。

对于得到的全基因组序列,也就是规模的序列数据,必须用全新的视角来观察,考虑怎样才能更好的组织和解读好这些数据。对于一个特定的农作物,如果还没有它的全基因组序列,可以用相关的亲缘关系近的同线物种的基因组来替代。由于水稻、高粱和其他重要的农作物有相似的基因组水平,水稻和高粱基因组全基因组测序完成已经对农作物生物技术学和农作物生物信息学产生了重大的影响。因此,生物信息学应用于农作物基因工程的研究必将有着广阔的前景。

1.2生物信息学资源生物信息学资源是由数据库、计算机网络和应用软件三大部分组成。目前,有一些大型生物学数据库包含了众多的生物学资源,我们可以方便地从国际互联网上查询,不仅方便了思想和资料的交流,减少了许多重复性的工作,也提供了一种新的工作方式和思维方式。

1.2.1核酸序列数据库用于核酸分析的数据库主要有GenBank、EMBL、DDBJ等3大数据库GenBank的数据来源于约140 000个物种,包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。EMBL现由EBI(European Bioinformatics Institute)管理,有全基因组鸟枪序列和序列版本文档加入。DDBJ近来开发了SQmatch~具,用来搜索基因或蛋白质中短的碱基或氨基酸序列区域,并建立了简便且易操作的SOAP服务器。

1.2.2蛋白质序列数据库蛋白质序列数据库主要有SWISS-PROT,它只收录已知蛋白质序列,并且每一条数据均有详细注释,包括功能、结构域、翻译后修饰以及一些相关的综述。TrEMBL是从EMBL库中的核酸序列翻译出来的氨基酸序列,并可以作为SWISS-PROT的一种补充。

1.2.3结构数据库结构数据库主要包括蛋白质结构、核酸结构、小分子数据库等。这里就重要的蛋白质结构数据库加以介绍。PDB(Protein Data Bank)是最为详尽的蛋白质结构数据库,它收录由x射线晶体衍射和核磁共振得到的三维结构数据。结构分类数据库主要是SCOP(Structural Classification ofProteins),它将已知蛋白质的结构按照进化与结构关系进行了全面的分类。

1.2.4基因组数据库基因组数据库主要是指人类基因组。TIGR数据库包含大量正在测定中的基因组数据,特别是EST序列以及cDNA数据库。人类基因组数据库主要是GDB(Getiome Database),它保存了大量人类基因图谱和疾病数据。Ensembl数据库拥有大量基因序列注释信息,目前包括脊椎动物、蠕虫和昆虫共9个基因组数据。

2生物信息学在农作物研究中的应用

    目前,生物信息学方法越来越广泛地被应用于农作物研究领域。许多文献的基因克隆思路是:先在基因组数据库中查询有关基因的序列信息,然后使用软件设计引物,接着运用RT-PCR克隆该基因,最后应用Southen杂交等技术对获取的基因进行检测。许多农作物微卫星序列(SSR)引物的开发也采取此策略,避免了烦琐的基因组文库杂交筛选工作。就水稻全基因组测序而言,一部分工作集中于基因组文库的构建和DNA序列的测定,而另外一部分工作则利用计算机软件对鸟枪法获得的片段进行组装拼接。

    Ewing等利用GenBank中获得的大量拟南芥和水稻EST也分析了这两个物种间的差异。利用禾谷类作物的共线性,根据拟南芥已知功能的基因序列,还可以为其他禾谷类作物未知功能的EST序列确定功能。Toda等依据类黄酮羟化酶基因F3’H的同源EST序列设计引物,扩增了长为1 690bp的sf3’hl基因,对sf3’hl基因的系列分析表明,sf3’hl与F3’H基因位于同一个T位点,并推测sf3’hl基因是因一个碱基缺失导致移码突变,从而控制大豆灰色茸毛的基因。缪海珍等通过对大豆、玉米、油菜、棉花等农作物样品的检测,由常规PCR技术进行验证,证实基因芯片的检测结果准确可靠,并提高了检测效率,可用于农作物转基因背景的鉴定。黄迎春等(2003)以2种报告基因、2种抗性基因、2种启动子序列和2种终止子序列为探针,利用其PCR产物制成基因芯片,对4种转基因水稻、木瓜、大豆、玉米进行检测,表现出快速、准确的优势。刘炬等利用基因芯片技术检测了转基因大豆(Roundup Ready)和非转基因大豆,表明芯片技术具有良好的特异性和重复性,检测灵敏度可达0.5%,而且效率很高。

可见,生物信息学已经成为生物学实验的一种有力的辅助工具,在植物科学中发挥着无比卓越的作用。在功能基因组日益兴盛的今天,生物信息学必将在植物科学领域扮演越来越重要的角色。

3生物信息学与农作物研究的展望

综上所述,植物功能基因组学已经取得了一定的进展。上述研究方法也只是功能基因组学研究中的一部分,各种方法都各有侧重点,也有各自的优缺点,可以相互辅助。有效运用生物信息学研究手段,结合我国特有的丰富的种质资源,大力开展中国优良农作物资源的研究,分离、克隆有自主知识产权的有重要经济价值的新基因及基因表达调控元件,发现控制优良性状基因的分子标记,为我国农作物应用研究和育种提供全面的生物信息学服务。而且随着基因组研究的深入和国际合作的加强,现有的研究手段将会不断完善和加强,也将会不断研发出新的研究技术,数据库系统也将会更趋丰富和共享度会更高,最终会研究清楚植物基因组的结构及功能。

 

栾剑  侯和胜(辽宁师范大学生命科学院,辽宁大连116029)

安徽农学通报2009.6

网友评论: