美国计算生物学专业解析

生物专业留学|2014年11月12日 16:43
美国计算生物学的研究内容主要包括以下几个方面:生物序列的片段拼接,序列对比,基因识别,种族树的建构,蛋白质结构预测和生物数据库。
  计算生物学涉及计算机、数学和生物学等领域广泛的科学知识和方法,将计算机科学发展成熟的知识、技术和方法应用到生物学的前沿,利用其卓越的数值计算能力来进行生物学的研究。它处理的是极大量的生物学资料、数据及对其复杂的计算。要达到这个目标,不仅需要先进的计算机硬件,适合而有效率的软件或演算方法更是计算生物学所必须的重要条件。这也说明了计算生物学作为一门交叉学科的典型特点。计算生物学不仅是生命学科与非生命学科的大交叉,同时也是生物学家(生物学问题)、数学物理学计算机科学家(基础理论问题)和工程师(技术应用)三种科学文化的大交叉。

  美国计算生物学的研究内容

  计算生物学是一门概念性学科,以生物信息为基础,以计算为工具,解决生物学问题。与生物信息学的定义类似,只是侧重点有所不同。计算生物学侧重于计算,通过计算来解决问题,并使用计算技术对生物学问题进行研究。生物信息学主要侧重于对生物学中所得信息的采集、存贮、分析处理与可视化方面。作为计算机科学、数学等学科与生命科学融合而成的现代生物科学的一个重要分支,计算生物学的研究内容主要包括以下几个方面:

  生物序列的片段拼接。人类细胞中的DNA、RNA以及蛋白质通常都表示成序列的形式,DNA与RNA是核甘酸序列(nucleotide sequence),而蛋白质是氨基酸序列(amino acid sequence)。人类系胞中整个DNA序列的长度大约为30,我们很难对这么长的序列作完整的分析研究。为了读出这些序列,必须先把这些序列分成一些较小的片断,然后再逐一还原成原来的整个序列。这一任务靠人工是无法完成的,这就需要计算机专家设计优良的算法,并建立相应的数值模型来优化定序工具从而加速完成这项定序工程,计算机每秒数以亿计的高速计算能力保证了序列片段拼接任务的完成。

  序列对比。为了探察生物个体分子水平上的遗传与功能信息,必须对DNA或RNA进行序列对比,找出功能或形态类似的分子之间的关联性。序列对比是分子生物学家最有用的计算机工具。这就说明分子生物学家还必须有精湛的计算机知识,懂得算法设计,数据建模直至计算机程序的编写,分子生物学家常用的序列分析程序有fsBLAST、FASTA等。Internet可以让世界各地的用户通过共用的接口使用公用基因序列数据库。通过fsBLAST或FASTA,可以将一个未知的DNA序列与公用基因序列数据库进行排比。序列对比研究在传统的计算机科学里已经广泛地进行过探讨,当它和分子生物学相互交叉、渗透并满足生物序列分析的特殊需求时,传统的序列分析被赋予了新的含义,开辟了新的用途。

  基因识别。人类长达30亿个DNA序列中,大约只有3%~5%是基因。阐明人体中全部基因的位置、结构、功能、表达、调控方式及致病突变的全部信息,计算机的数据管理、误差控制、计算能力扮演了一个重要的角色。剩下95%~97%的DNA序列认定也是基因识别的另外一个研究方向。

  种族树的建构。这是计算机科学中数据结构研究的经典内容,如果我们手边有一大堆序列,我们能不能根据这些序列的内容来画出涵盖这些序列的种族树?我们如何判断哪些序列之间有亲缘关系?有多亲?要回答这些问题,就必须建立DNA序列的种族树,以生物序列的比较来求得种族之间的两两距离,从而判断亲缘关系。

  蛋白质结构预测。蛋白质的很多特性、功能是和它实际的三维结构极其相关,其实任意给一段蛋白质序列,生物学家就可以用传统的生物学方法(如X光绕射)求出其结构,但是,这种方法不但成本较高且费时。计算生物学的蛋白质结构预测工具通过序列分析而直接得出其结构,然后再用实验验证这种结构的正确性,相对传统方法而言,要高效省时得多。

  生物数据库。当前,生物学数据量不断增长,每14个月基因研究产生的数据就会翻一番,海量的数据单单依靠观察和实验已无能为力,传统的数据库技术这时显示了强大的威力。在做好数据库结构设计的基础上,结合生物学数据的特点,建立生物信息数据库。再依靠大规模的计算模拟技术,利用数据库的常规操作,就可以从海量信息中提取自己需要的生物学数据。因为数据库以数字方式存取资料,数据的存取非常容易,远远超过传统的纪录方式。以往的研究工作始于实验室,如今先从计算机开始。计算机取代实验室中用以搜集数据与控制实验的设备,就如同作家的打字机或是会计的帐簿被计算机取代了一样,它更有可能完全取代实验室储存资料的笔记本与档案柜。目前常用的数据库有(GenBank、EMBL、SWISS-PROT、PDB数据库等。)

我要咨询

您的姓名 所在地区
联系电话 QQ
意向国家 邮箱Email
咨询内容
 
留学专业大联盟