蛋白质结构分析系列(三)

转自公众号:universebiologygirl
http://mp.weixin.qq.com/s?__biz=MzU1NDkzOTk2MQ==&mid=2247487597&idx=1&sn=7dc0914b266dd5dadbfcb88c5b5c37cb

蛋白质结构分析系列(三):同源建模的理解

写在前面的
上一次推文实则把同源建模的本地操作提前讲了。因为考虑到能初步独立在本地电脑根据同源蛋白的晶体结构跑出目标蛋白的模拟建模结构后再回过来理解同源建模,那么大家对同源建模的概念理解、实际操作会更熟练。这次的推文,我们从源头的概念上理解同源建模。

同源or相似

        最近经常看见一些推文或者新闻报道,同源性95%之类的。其实这些推文和新闻报道犯了一个概念性错误。他们没有理解同源性、相似性、一致性三个相似而又有差异的概念。
        Homology(同源性):两个不同的生物分子从进化上来源于同一祖先且这两个生物分子在进化上处于这个祖先分子分支下的两个不同节点。所以同源性是从进化关系上描述不同生物分子之间有或者无同源关系的词语。对于有同源性的物种可以描述为“部分同源”或者“完全同源”。所以最近的一些新闻报道或推文中写到二者同源性99%等这类说法是错误的,A和B之间要么就是同一个祖先来的(有同源性),要么就不是同一祖先进化来的(没有同源性)。同源性没有百分比的说法!
        Similarity(相似性):两个或多个生物分子之间相同部分占总体百分比的宏观描述:例如两条核酸序列之间比对后相同位点的相同碱基总数占比对长度的百分比。或氨基酸序列的比对中相同或相似氨基酸(如同性氨基酸)残基占总比对长度的百分比(描述可能不太准确)。
        Identity(一致性):在相似性描述的基础上,站在更微观的角度对两条序列间相同位点的一致性程度的描述。

什么情况下可以进行同源建模

        按照上面的概念可以推出,同源不一定相似,相似不一定同源。如果从功能蛋白质组学的角度,进行同源建模的前提是两种蛋白质具有相同和相似的功能,且其中一种蛋白质已经被解析晶体结构。根据经验,当相似度大于30%时可以进行同源建模。一般情况下,相似度越高,同源建模预测的结构越接近真实结构。但是依然存在某些情况,尽管目标蛋白与模板蛋白具有超过90%相似度,但是预测出的结构与真实结构相差较大。我印象中在学习同源建模的时候读到过一篇文献,大意是目标蛋白与模板蛋白相似度已经超过92%,但是同源建模预测出的beta折叠与实际情况相反。

序列比对在同源建模中重要性

        与模板蛋白进行序列比对和排列,可以锚定蛋白质序列中的保守序列。这是同源建模的基础。序列比对的知识可以迁移为常规序列比对知识。不过在同源建模比对中序列比对矩阵分为四大矩阵:相似性矩阵(Identity matrix)、疏水性矩阵(Hydrophobic matrix)、密码子替换矩阵(Codon substitution matrix)和突变矩阵(Mutation matrix),每一种矩阵都是对矩阵内要比对的序列的每一个氨基酸残基进行比较,并根据相似性或疏水性等对各种矩阵关注的特征赋予的一定的权重。只有完成序列比对,才可以根据目标序列的残基坐标信息赋予目标序列的残基坐标信息,此时残基坐标信息的赋予则根据残基是否处于保守区进行一定的刚/柔性构象的改变处理,一般情况下认为保守区以外的区域具有较大柔性。此处强烈推荐下图的Protocol.里面有详细讲述比对的模型原理。

蛋白质结构分析系列(三)

傻瓜式的同源建模操作

        如果说上一次推文介绍的如何在Linux系统中进行同源建模,那么这一次通过傻瓜式同源建模操作再进一步理解同源建模中的原理。使用SWISS-MODEL进行在线同源建模https://swissmodel.expasy.org/。例如,下图中我粘贴了SARS-CoV-2的RBD序列(PDB Accession: 6M17),点击Build Model即可进行建模。在线同源建模减少了本地操作的繁琐,相对的由于在线版本参数是固定的,如果想进行个性化分析,仍然建议使用本地同源建模。

蛋白质结构分析系列(三)

        同源建模完成后,网页自动输出如下界面。右边的大图是目标序列同源建模的空间结构。左边有如下需要重点理解的参数值。1.GMQE(反映可信度),取值范围0~1,越大代表可信度越高。2.QMEAN(反映目标蛋白与模板蛋白匹配度),取值范围-4~0,越接近0代表匹配度越高(如下图,QMEAN下标注了大拇指图标,表示很好了)3.图片右下角Cartoon、Spacefill等不同模式的切换以改变三维结构展示样式,旁边的拍照图标可以下载图片。

同源建模结果的适用范围及不合理性

根据经验:
1.如果一致性在30~50%,那么同源建模准确率约80%,可以根据预测结果推断功能结构域。
2.如果一致性在50~70%,那么同源建模准确率约95%,可以进行突变实验设计等。
3.如果一致性大于70%,那么同源建模准确率接近100%,可以进行分子对接、酶设计等实验。
4.任何情况下同源建模都有可能出现与真实结构存在较大差异,如键长、残基方向等。采取多模板建模,选择最佳建模结果是尽可能减少这种情况出现的方式。

蛋白质结构分析系列(三)》来自互联网公开内容,收录仅供学习使用,如侵权请联系删除。本文URL:https://www.ezixuan.com/1020474.html

(0)
上一篇 2023年 1月 27日 上午9:48
下一篇 2023年 1月 27日 上午9:48