您好,欢迎来到保捱科技网。
搜索
您的当前位置:首页生物信息学

生物信息学

来源:保捱科技网


BLAST中,E值和P值分别是什么,它们有什么意义?

答:BLAST中使用的统计值有概率p值和期望e值。

E期望值(E-value)这个数值表示你仅仅因为随机性造成获得这一比对结果的可能次数。这一数值越接近零,发生这一事件的可能性越小。从搜索的角度看,E值越小,比对结果越显著。默认值为10,表示比对结果中将有10个匹配序列是由随机产生,如果比对的统计显著性值(E值)小于该值(10),则该比对结果将被检出,换句话说,比较低的E值将使搜索的匹配要求更严格,结果报告中随机产生的匹配序列减少。

p值表示比对结果得到的分数值的可信度。一般说来,p值越接近于零,则比对结果的可信度越大;相反,p值越大,则比对结果来自随机匹配的可能性越大。

12. 举例说明蛋白质序列、结构和功能的关系。

答:蛋白质的一级结构即氨基酸序列决定其高级结构和功能。通过比较同源蛋白质的氨基酸序列的差异可以研究不同物种亲缘关系和进化。亲缘关系越远,同源蛋白质氨基酸序列差异就越大。基因突变引起某个功能蛋白的某一个或几个氨基酸残基发生了遗传性替代,从而导致整个分子的三维结构发生改变,功能部分或全部丧失。一级结构的部分切除与部分蛋白质的激活具有密切关系。蛋白质多种多样的生物功能是以其化学组成和极其复杂的结构为基础的,不仅需要一定的空间构象,蛋白质的空间构象取决于其一级结构和周围环境。蛋白质的生物学功能是蛋白质分子天然构象所具有的的属性或所表现的性质。

例如:胰岛素。首先合成前胰岛素原,前胰岛素原含信号肽,在内质网中,信号肽被信号肽酶切除成为胰岛素原;随即在高尔基体切除A、B链之间的一段氨基酸(称为C肽),

形成胰岛素。

不同种属的胰岛素有24氨基酸残基的位置始终不变:A、B链上6个Cys不变,其余18个氨基酸多数为非极性侧链,对高级结构起稳定作用。6个Cys的位置始终不变,说明不同种属的胰岛分子中A、B链之间有共同的连接方式,三对二硫键对维持高级结构起着稳定作用。

13. 以具体实例说明利用生物信息学对核酸序列进行分析的策略。

序列分析的任务和目的分别是什么? 答:任务:(1)发现序列之间的相似性;(2)辨别序列之间的差异。 目的:(1)相似序列:相似的结构,相似的功能 (2)判别序列之间的同源性(3)推测序列之间的进化关系

【实验内容】 1、使用Entrez信息查询系统检索人瘦素 (leptin) 的mRNA、基因组DNA、外显子等核酸序列,连接提取该序列内容,阅读序列格式的解释,理解其含义; 2、使用DNAclub对上述核酸序列进行分析 3、使用DNAclub软件对人瘦素 (leptin) 的mRNA序列进行可读框架分析; 4、使用NCBI查询系统进行人瘦素 (leptin) 的基因组序列分析 【实验方法】 1、 调用Internet浏览器,并在其地址栏输入Entrez网址:http://www.ncbi.nlm.nih.gov/gquery/ 在输入栏输入homo sapiens leptin; 点击go后显示与LEP相关的序列信息,查找人leptin 的mRNA序列,点击序列接受号后显示序列详细信息;阅读并理解Genbank注释信息。 2、或:进入NCBI主页,http://www.ncbi.nlm.nih.gov/ , 在Search后的选择栏中选择nucleotide;在输入栏输入homo sapiens leptin;点击search后显示与LEP相关的序列信息,查找人leptin 的mRNA或基因,点击序列接受号后显示序列详细信息; 3、将序列转为FASTA格式保存 4、将上述核酸序列输入DNAClub软件进行序列基本分析(反向或互补序列转换,开放阅

读框寻找,序列翻译,酶切位点查找); 5、根据基因定位信息(Gene ID: 3952)查找人瘦素的基因组DNA (Contig) 的序列识别号NC_000007,点击序列接受号显示序列详细信息; 6、分析人瘦素 (leptin) 的基因组序列;查找外显子与内含子序列。

14. 以具体实例分析说明利用生物信息学进行蛋白质结构分析及预测的思路。

1、 瘦素蛋白质序列的检索: (1)调用Internet浏览器并在其地址栏输入Entrez网址http://www.ncbi.nlm.nih.gov/Entrez 在输入栏输入homo sapiens leptin; 点击go后显示与LEP相关的序列信息,查找人leptin 的蛋白序列,点击序列接受号后显示序列详细信息;阅读并理解Genbank注释信息。 或:进入NCBI主页,http://www.ncbi.nlm.nih.gov/ , 在Search后的选择栏中选择protein;在输入栏输入homo sapiens leptin;点击search后显示与LEP相关的序列信息,查找人leptin 的蛋白序列,点击序列接受号后显示序列详细信息; (2)将序列转为FASTA格式保存; 2、进入EXPASY网站使用有关软件进行蛋白质序列分析和结构预测。 http://www.expasy.ch/tools/ (1)选择Protparam程序和Compute pI/Mw对蛋白质序列进行氨基酸组成、分子质量和等电点等基本性质分析; (2)蛋白质的同源性搜索分析,使用Similarity searches的BLAST; (3)在Pattern and profile searches中选择interPro Scan 进行结构域或motif搜索。 (4)在post-translational modification prediction 选择signalP对蛋白质序 列进行信号肽预测分析

15. 查询10个物种以上的基因或蛋白质序列,用MEGA进行系统树分析,简述其计算和分析过程,并绘制系统树。

对于一个完整的进化树分析需要以下几个步骤: ⑴ 要对所分析的多序列目标进行比对。 ⑵ 要构建一个进化树(phyligenetic tree)。 ⑶ 对进化树进行评估,主要采用Bootstrap法。进化树的构建是一个统计学问题,所构建出来的进化树只是对真实的进化关系的评估或者模拟。如果采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。模拟的进化树需要一种数学方法来对其进行评估。 CLUSTALX和MEGA软件能够实现上述的建树步骤。CLUSTALX是Windows界面下的多重序列比对软件。MEGA是多个软件的压缩包,功能极其强大,主要包括五个方面的功能软件:i,DNA和蛋白质序列数据的分析软件。ii,序列数据转变成距离数据后,对距离数据分析的软件。 iii,对基因频率和连续的元素分析的软件。iv,把序列的每个碱基/氨基酸看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。v,按照DOLLO简约性算法对序列进行分析的软件。vi,绘制和修改进化树的软件。 【实验内容】 1、使用CLUSTALX软件对一组蛋白质序列(leptin.txt)进行多重序列比对;

一、用CLUSTALX软件对已知序列做多序列比对。 1、在NCBI数据库搜索人leptin的同源蛋白序列 2、下载leptin的同源蛋白序列8-10条,以FASTA格式保存为leptin.txt文件。 2、双击进入CLUSTALX程序,点FILE进入LOAD SEQUENCE,打开leptin.txt文件。 3、点ALIGNMENT,在默认alignment parameters下,点击Do complete Alignment 。在新出现的窗口中点击ALIGN进行比对,这时输出两个文件(默认输出文件格式为Clustal格式):比对文件test.aln和向导树文件test.dnd。 二、用MEGA软件推导进化树 1、查找并下载Mega软件 2、安装Mega软件 3、应用Mega软件构建分子系统树: 1)双击打开Mega软件,在File下拉框中选Convert to mega format,将多重比对的.aln文件转换为.meg文件,保存文件。 2)再次打开Mega软件,选择click me to activate a data file, 选转换后保存的.meg文件打开,进行相关序列分析。 3)系统进化分析:参照MEGA操作说明书进行

二 、以一个基因或者酶蛋白,查询10个物种以上此基因或者酶蛋白的序列,用本地软件做系统树分析,并简单点评你的结果。(本题满分30分) 答:在这里仍以Prion蛋白为例做系统树分析,步骤如下: (1)从NCBI查询Prion蛋白序列,下载其中12个物种的,以“fasta格式”格式保存; (2)对下载的每个序列用记事本打开,检查序列的格式是否统一,并复制、粘贴到其中任意一个文件里; ( 3)在MEGA界面中,选择Alignment→ Alignment Explorer/CLUSTAL,出现下面的 单击“NO”即可。 (4)在M4界面中,单击Date → Open → Retrieve Sequences from File ,选择已保存的FASTA格式文件; (4)在M4界面中,双击文件名可以进行修改,然后右键菜单点击删除Clustal X中附带 “※”的行,然后点击Ctrl+A选中所有序列,依次点击Alignment→Align by ClustalW→出现的界面点击 OK; (5)在M4界面中,选择Data → Expert Alignment → MEGAFormat(保存该文件并命名),即把FASTA格式文件转化为MEGA格式文件; (6)关闭M4界面,出现界面Open The Data File in MEGA → 点击YES→ 出现一个新界面,在MEGA4界面中,选择Phlogeny → Construct Phlogeny → 选择(NJ、ME、MP、UPGMA)等进化树结构类型→Compute,即可得到进化树; (7)在MEGA4界面中,选择Phlogeny → Bootstrap Test of Phylogeny → 选择进化树结构类型(NJ、ME、MP、UPGMA)→ Compute,即可得到进化树; (8)在有进化树的M4界面选择Image → Copy to Clipboard → 直接粘贴到Word文档。 图1:原始进化树 Neovison vison Canis lupus familiaris Bos taurus Ovis aries Homo sapiens Rattus norvegicus Mus musculus Saccharomyces cerevisiae YJM7 Danio rerio Xenopus tropicalis homolog Gallus gallus Monodelphis domestica 图2:Bootstrap进化树 Homo sapiens Bos taurus Ovis aries Neovison vison Canis lupus familiaris Rattus norvegicus Mus musculus Saccharomyces cerevisiae YJM7 Danio rerio Xenopus tropicalis homolog Gallus gallus Monodelphis domestica 结果点评:系统树结构较为清晰,利于分析。 备注:Homo sapiens—人;Saccharomyces cerevisiae—酿酒酵母;Xenopus (Silurana) tropicalis—热带爪蟾;

Danio rerio—斑马鱼;Bos taurus—瘤牛;Rattus norvegicus—褐家鼠;Mus musculus—小家鼠;Gallus gallus—鸡内金;Canis lupus familiaris—犬狼疮familiaris;Monodelphis domestica

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- baoaiwan.cn 版权所有 赣ICP备2024042794号-3

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务