您好,欢迎来到保捱科技网。
搜索
您的当前位置:首页生物信息学

生物信息学

来源:保捱科技网
维普资讯 http://www.cqvip.com 随着生物科学技术的迅猛发展,数据资源急剧膨胀。为 快捷方便地对已知生物学知识进行储存、管理及进一步利 用.一门融合了生物科学与计算科学的新学科工具——生物 信息学悄然兴起。 生物信息学 陈颖健 一、生物信息学的诞生 及其重要性 导下的试验验证上来,生物科学 正在经历着从分析还原思维到系 统整合思维的转变。 生物信息学成为生物科学在 21世纪的重要研究开发工具。 律。 从事生物信息学研究应具备 多方面的科学基础。首先,它需要 一早在1956年美国田纳西州 盖特林堡召开的首次“生物学中 定的计算能力,包括相应的软、 硬件设备。要有各种数据库或者 能与国际、国内的数据库系统进 行有效的交流。要有发达、稳定的 互联网络系统;同时,生物信息学 需要强有力的创新算法和软件。 没有算法创新,生物信息学就无 法获得持续的发展。最后,它要与 的信息理论研讨会”上便产生了 生物信息学的概念。然而,就生物 信息学的发展而言,它是一门相 当年轻的学科,是伴随上世纪末 计算科学的进步才获得了突破性 进展。 二、生物信息学与 基因组研究 生物信息学的研究内容是伴 随着基因组研究而发展的。广义 自1987年林华安博士正式 地说,生物信息学从事对基因组 为这一领域定下生物信息学 研究相关生物信息的获取、加 (Bioinformatics)这一“称谓”以 实验科学,特别是与自动化的大 规模高通量的生物学研究方法与 技术建立广泛而紧密的联系。它 们既是产生生物信息数据的主要 方法,又是验证生物信息学研究 结果的关键-T-段。 工、储存、分配、分析和解释。这 海量数据的收集、整理与服务, 即管理好这些数据;二是从中发 据。 来,其内涵随着研究的深入和现 个定义的含义是双重的:一是对 实需要的变化而几经更迭。目前, 一般认为,生物信息学主要是一 中信息流的综合系统科学,通过 其独特的桥梁作用和整合作用, 门研究生物学系统和生物学过程 现新的规律,也就是用好这些数 具体地说,生物信息学是把 基因组DNA序列信息分析作为 源头,找到基因组序列中代表蛋 三、生物信息学的 主要研究内容 纵观当今生物信息学界的现 使人们能够从各生物学科众多分 散的观测资料中,获得对生物学 系统和生物学过程运作机制的理 白质和RNA基因的编码区;同 状,可以发现大部分研究人员都 解,最终达到自由应用于实践的 时,阐明基因组中大量存在的非 把注意力集中在基因组、蛋白质 目的 生物信息学的实质就是利 编码区的信息实质,破译隐藏在 组、蛋白质结构以及与此密切相 用计算机科学和网络技术来解决 DNA序列中的遗传语言规律。在 关的药物设计上。 生物学问题。 此基础上,归纳、整理与基因组遗 传信息释放及其相关的转录 谱和蛋白质谱的数据,从而认识 1、基因组 1.1、获取人和各种生物的完 在21世纪初,生物科学的重 点已由20世纪的试验分析和数 据积累,转移到数据分析及其指 整基因组 生物代谢、发育、分化、进化的规 基因组研究的首要目标是获 ————一I—●—■■●—一 国外科技动态■ 2002年第JD期(总第399期) I39 维普资讯 http://www.cqvip.com 得人的整套遗传密码。人的遗传 因。 密码有32亿个碱基,要得到人的 发现新基因会加深人类对生 必须通过它所表达的全部蛋白质 来执行,由于基因芯片技术只能 全部遗传密码首先要把人的基因 命活动的认识。例如,人的第22 反映从基因组到RNA的转录水 组打碎,测完一个个小段的序列 后再把它们重新拼接起来。 号染色体数据已鉴定出679个基 平上的表达情况,而从RNA到蛋 因,其中55%的基因是未知的。 白质还有许多中间环节的影响, 迄今为止,人们对人类基因 有35种疾病与该染色体的突变 这样,仅凭基因芯片技术人们还 组真正掌握规律的只有DNA上 有关,如免疫系统疾病、先天性 不能最终掌握生物功能的具体执 行者——蛋白质的整体表达状 的编码蛋白质的区域,最新资料 心脏病和精神症等。但是, 1.1%。在高等生物和人的基因组 的蛋白质,以及与它们相关的功 表明这部分序列只占基因组的 要将人类的所有基因及其相应 况。因此,近年在发展基因芯片的 同时,人们还发展了一套研究基 中非编码序列已占到基因组序列 能完整而正确地整合到一个索 的绝大部分。这表明非编码序列 引中,仍然是一项十分艰巨的任 具有重要的生物功能。由于它们 务。国际人类基因组计划协作组 并不编码蛋白质,一般认为,它们 正在着手建立完整的“整合基因 的生物学功能可能体现在对基因 索引”及相关的“整合蛋白索 表达的时空上。 引”。 1.2、发现新基因和新的单核 (2)发现单核苷酸多态 苷酸多态性 有的人吸烟喝酒却长寿,也 发现新基因是当前国际上基 有人自幼就病痛缠身;同一种治 因组研究的热点,使用生物信息 疗肿瘤的药物对一些人非常有 学的方法是发现新基因的重要手 效,对另一些人则完全无效。这是 段 为什么?答案是他们的基因组存 (1)发现新基因 在差异。这种差异很多表现为单 利用EST(Expressed Se— 个碱基上的变异,也就是单核苷 quence Tags)数据库发现新基因 酸的多态性(single nucleotide 称为基因的“电脑克隆”。EST序 polymorphism,SNP)。 列是基因表达的短cDNA序列, 一般认为,SNP研究是人类 它们携带着完整基因的某些片段 基因组计划走向应用的重要步 的信息。通过计算分析从基因组 骤。这主要是因为SNP将提供一 DNA序列中确定新基因编码区, 个强有力的工具,用于高危群体 已经形成许多分析方法,如根据 的发现、疾病相关基因的鉴定、 编码区具有的独特序列特征、根 药物的设计和测试以及生物学 据编码区与非编码区在碱基组成 的基础研究等。SNP在基因组中 上的差异等。截止到2001年10 分布相当广泛,近年的研究表 月,在GenBank的EST数据库 明,在人类基因组中每300个碱 中,人类EST序列已超过380万 基对就出现一次。大量存在的 条,它大约覆盖了人类基因的 SNP位点,使人们有机会发现与 90%以上。 各种疾病相关的基因组突变。从 此外,还可以从基因组序列 实验操作来看,通过SNP发现疾 预测新基因,其本质是把基因组 病相关基因突变要比通过家系 上编码蛋白质的区域和非编码蛋 来得容易,有些SNP并不直接导 白质的区域区分开。从方法上讲, 致疾病基因的表达,但由于它与 就是找出在编码区和非编码区有 某些疾病基因相邻,因而成为重 哪些数学和物理学特征是不一样 要的标记。 的,将这些序列与已知基因数据 2、蛋白质组 库进行比较,就可以发现新基 基因组对生命体的整体控制 ■■■●—■——■●—●—一 一国外科技动态 4O  l2002年第j口期(总第399期) 因组所有蛋白质产物表达情况的 技术——蛋白质组研究技术,从 技术上讲包括二维凝胶电泳技术 和质谱测序技术。通过二维凝胶 电泳技术可以获得某一时间截面 上蛋白质组的表达情况,通过质 谱测序技术则可以得到所有这些 蛋白质的序列组成。然而,最重要 的是如何运用生物信息学的方法 去分析获得的海量数据,从中还 原出生命运转和的整体系统 的分子机制。 3、蛋白质结构及新药设计 基因组和蛋白质组研究的迅 猛发展,使许多新蛋白序列涌现 出来。然而,要了解它们的功能, 只有氨基酸序列是远远不够的, 因为蛋白质的功能是通过其三维 结构来执行的,而且蛋白质的三 维结构不一定是静态的,在执行 功能的过程中,其结构会有所改 变。目前,除了通过诸如x射线 晶体结构分析、核磁共振波 谱分析和电子显微镜二维晶体三 维重构等物理方法获得蛋白质的 三维结构之外,广泛使用的一种 方法是通过计算机辅助预测的方 法。一般认为,蛋白质的折叠类型 只有数百到数千种,远远小于蛋 白质所具有的自由度数目,而且 蛋白质的折叠类型与其氨基酸序 列具有相关性,这样就有可能直 接从蛋白质的氨基酸序列,通过 计算机辅助方法预测出蛋白质的 三维结构。 近年,随着结构生物学的发 维普资讯 http://www.cqvip.com 展,相当数量的蛋白质以及一些 核酸、多糖的三维结构获得了精 确的测定,根据生物大分子结构 的知识,有针对性地设计药物成 为热点。生物信息学的研究不仅 可以提供生物大分子空间结构的 信息,还能提供电子结构的信息, 如能级、表面电荷分布、分子轨道 相互作用以及动力学行为的信 息,如生物化学反应中的能量变 化、电荷转移、构像变化等。理论 模拟还可以研究包括生物分子及 其周围环境的复杂体系和生物分 子的量子效应。但是,生物信息学 的任务远不止于此,在上述研究 工作的基础上,最重要的是如何 白质数据库由美国、欧洲和日本 月,美国NIH的一个顾问小组建 的3家数据库系统产生,他们共 议在生物计算领域设立总额为数 同组成了DDBJ/EMBL/GenBank 亿美元的重大科研基金,并成立 运用数理理论成果,对生物体进 行完整系统的数理模型描述,以 便使人类能够从一个更明确的角 国际核酸序列数据库,每天交换 5到20个计算中心以处理海量 数据,同步更新。其他一些国家, 如德国、法国、意大利、瑞士、澳 的基因组相关信息。 国内对生物信息学领域也越 授的带领下,在各自领域取得了 一度和一种更易于操作的方式来认 大利亚、丹麦和以色列等,在分 来越重视,在一些著名院士和教 识和控制自身以及所有其他的生 享网络共享资源的同时,也分别 命体。 建有自己的生物信息学机构、二 级或更高级的具有各自特色的 定成绩,有的在国际上还占有 席之地,如北京大学的罗静初 和顾孝诚教授在生物信息学网站 建设方面、中科院生物物理所的 一四、国内外生物 专业数据库以及自己的分析技 术,服务于本国生物(医学)研究 信息学的现状 国外一直非常重视生物信息 和开发,有些服务也对全世界开 学的发展,各种专业研究机构和 放。 公司如雨后春笋般涌现出来,生 陈润生研究员在EST序列拼接方 面以及在基因组演化方面、天津 大学的张春霆院士在DNA序列 的几何学分析方面都取得重要成 近年,美国一些最著名的大 物科技公司和制药工业内部的生 学,如哈佛大学、普林斯顿大学、 物信息学部门的数量也与日俱 斯坦福大学、加州大学伯克利分 果。北京大学于1997年3月成立 增。由于对生物信息学的需求是 校等都投资几千万到一亿多美元 了生物信息学中心,中科院上海 如此迅猛,即使是美国这样的发 匮乏的局面。 成立了生物学、物理学、数学等学 生命科学研究院也于2000年3 达国家也面临着供不应求、人才 科交叉的新中心,诺贝尔奖获得 月成立了生物信息学中心,分别 者朱棣文领导的斯坦福大学的中 维护着国内两个专业水平相对较 总体来看与国际水平差距很大。 此外,国内生物(医药)科学研究 与开发对生物信息学研究和服务 目前,绝大部分的核酸和蛋 心还命名为Bio—X。1999年6 高的生物信息学网站,但从全国 的需求市场非常广阔。但是,真正 开展生物信息学具体研究和服务 的机构或公司却相对较少,仅有 的几家科研机构主要开展生物信 息学理论研究,生物信息学服务 公司提供的服务仅局限于简单的 计算机辅助分子生物学实验设 计,而且服务体系也不完善。..I ——●—■■——■■●●■●■●一 目外科技动态● 2002年第JO期(总第399期) l4l 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- baoaiwan.cn 版权所有 赣ICP备2024042794号-3

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务