系统发育树

资源ID：55689329 资源大小：417.00KB 全文页数：6页
资源格式： PDF 下载权限：游客/注册会员 下载费用：10积分【人民币10元】

快捷注册下载

会员登录下载

三方登录下载：

下载资源需要10积分【人民币10元】

邮箱/手机：
温馨提示：	支付成功后，系统会自动生成账号（用户名和密码都是您填写的邮箱或者手机号），方便下次登录下载和查询订单；
支付方式：
验证码：	换一换

下载资源需要10积分【人民币10元】

已注册用户请登录：

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，既可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰

网站客服

侵权投诉

系统发育树

分子进化树构建及数据分析的简介分子进化树构建及数据分析的简介 mediocrebeing, rodger, lylover[1], klaus, oldfish, yzwpf 一、引言一、引言开始动笔写这篇短文之前，我问自己，为什么要写这样的文章写这样的文章有实际的意义吗我希望能够解决什么样的问题带着这样的疑惑，我随手在丁香园（DXY）上以关键字“进化分析求助”进行了搜索，居然有 289 篇相关的帖子（2006 年 9 月 12 日）。而以关键字“进化分析”和“进化”为关键字搜索，分别找到 2,733 和 7,724 篇相关的帖子。考虑到有些帖子的内容与分子进化无关，这里我保守的估计，大约有 3,0004,000 篇帖子的内容，是关于分子进化的。粗略地归纳一下，我大致将提出的问题分为下述的几类 1．涉及基本概念。例如， “分子进化与生物进化是不是一个概念”，“关于微卫星进化模型有没有什么新的进展”以及“关于 Kruglyak 的模型有没有改进的出现”，等等。 2．关于构建进化树的方法的选择。例如，“用 boostrap NJ 得到 XX 图，请问该怎样理解能否应用于文章用 boostrap test 中的 ME 法得到的是 XXX 树，请问与上个树比，哪个更好”，等等。 3．关于软件的选择。例如， “想做一个进化树，不知道什么软件能更好的使用且可以说明问题，并且有没有说明如何做”，“拿到了 16sr RNA 数据，打算做一个系统进化树分析，可是原来没有做过这方面的工作啊，都要什么软件”，“请问各位高手用 clustalx 做出来的进化树与 phylip 做的有什么区别”，“请问有做过进化树分析的朋友，能不能提供一下，做树的时候参数的设置，以及代表的意思。还有各个分支等数值的意思，说明的问题等”，等等。 4．蛋白家族的分类问题。例如，“搜集所有的关于一个特定 domain 的序列，共 141 条，做的进化树不知具体怎么分析”，等等。 5．新基因功能的推断。例如， “根据一个新基因 A 氨基酸序列构建的系统发生树，这个进化树能否说明这个新基因 A 和 B 同源，属于同一基因家族”，等等。 6．计算基因分化的年代。例如，“想在基因组水平比较两个或三个比较接近物种之间的进化年代的远近，具体推算出他们之间的分歧时间”，“如何估计病毒进化中变异所需时间”，等等。 7．进化树的编辑。例如生成的进化树图片，如何进行后续的编辑，比如希望在图片上标注某些特定的内容，等等。由于相关的帖子太多，作者在这里对无法阅读全部的相关内容而致以歉意。同时，作者归纳的这七个问题也并不完全代表所有的提问。对于问题1所涉及到的基本的概念，作者推荐读者可参考由Masatoshi Nei与Sudhir Kumar所撰写的分子进化与系统发育（Molecular Evolution and Phylogenetics）一书，以及相关的分子进化方面的最新文献。对于问题 7，作者之一 lylover 一般使用 Powerpoint 进行编辑，而 Photoshop、Illustrator 及 Windows 自带的画图工具等都可以使用。这里，作者在这里对问题 2-6 进行简要地解释和讨论，并希望能够初步地解答初学者的一些疑问。二、方法的选择二、方法的选择 First of all, I have no intention to be offensive, please take my apology if you feel like that. I am not sure about the purpose of this draft, is it only for watering in or something else Simply ignore my suggestions when you think its reasonable. 首先是方法的选择。基于距离的方法有UPGMA、ME（Minimum Evolution，最小进化法）和 NJ（Neighbor-Joining，邻接法）等。其他的几种方法包括MP（Maximum parsimony，最大简约法）、 ML （Maximum likelihood，最大似然法）以及贝叶斯（Bayesian）推断等方法。其中 UPGMA 法已经较少使用。一般来讲，如果模型合适，ML 的效果较好。对近缘序列，有人喜欢MP，因为用的假设最少。 MP 一般不用在远缘序列上，这时一般用 NJ 或 ML。对相似度很低的序列， NJ 往往出现 Long-branch attraction（LBA，长枝吸引现象），有时严重干扰进化树的构建。All tree-reconstruction s suffer from long branch attraction including ML, the situation is the worst for MP. Better mention it is not only for NJ.贝叶斯的方法则太慢。 MP can also be extremely slow if we have a large number of sequences because of all the possible “equally parsimonious trees”对于各种方法构建分子进化树的准确性，一篇综述（Hall BG. MolBiolEvol 2005, 223792-802）认为贝叶斯的方法最好，其次是 ML，然后是 MP。其实如果序列的相似性较高，各种方法都会得到不错的结果，模型间的差别也不大。Maybe it is worthwhile to list another two review papers, Trends in Genetics 17262–272 2001, Nature Rev. Genet. 4275–2842003. They were not branch newly published in 2005 or 2006, but they comprehensive and actually the basic ideas never changed. 对于 NJ 和 ML，是需要选择模型的。For distance s like NJ, the single most important thing is the distance matrix while we do not have to obtain this matrix under a specific substitution model. 对于各种模型之间的理论上的区别，这里不作深入的探讨，可以参看 Nei 的书。对于蛋白质序列以及 DNA 序列，两者模型的选择是不同的。以作者的经验来说，对于蛋白质的序列，一般选择 Poisson Correction （泊松修正）这一模型

注意事项

本文（系统发育树）为本站会员（sunhongz115）主动上传，蚂蚁文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知蚂蚁文库（发送邮件至2303240369@qq.com或直接QQ联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。