蛋白质二级结构预测

在蛋白质结构和功能的分析研究中蛋白质二级结构预测是一个重要的基础组成部分。Chou-Fasman算法是最早的成功用于二级预测的算法之一,利用Chou-Fasman法可以快速对蛋白α-螺旋、β-折叠、β-转角等二级结构进行预测。

使用方法

原理

Chou-Fasman方法是一种基于单个氨基酸残基统计的经验参数方法。每种氨基酸残基出现在各种二级结构中倾向或者频率是不同的(例如Glu主要出现在α-螺旋中,Asp和Gly主要分布在转角中,Pro也常出现在转角中,但是绝不会出现在α-螺旋中),通过统计分析获得的每个残基出现于特定二级结构构象的倾向性因子(在Chou-Fasman方法中,这几个因子是Pα、Pβ和Pt,它们分别表示相应的残基形成α-螺旋、β-折叠和转角的倾向性),进而利用这些倾向性因子预测蛋白质的二级结构。

在统计得出氨基酸残基倾向性因子的基础上,Chou和Fasman提出了二级结构的经验规则,其基本思想是在序列中寻找规则二级结构的成核位点和终止位点。在具体蛋白二级结构预测的过程中,首先扫描待预测的氨基酸序列,利用一组规则发现可能成为特定二级结构成核区域的短序列片段,然后对于成核区域进行扩展,不断扩大成核区域,直到二级结构类型可能发生变化为止,最后得到的就是一段具有特定二级结构的连续区域。

结果分析

利用该工具可以得到序列中各个氨基酸的Pα、Pβ及Pt的值。根据工具的分析结果,结合Chou-Fasman算法即可进行二级结构的预测。

表底部存在滑块,可以通过滑动滑块对某一段特定序列进行分析。

α螺旋

沿着蛋白质序列寻找α-螺旋核,相邻的6个残基中如果有至少4个残基对应的Pα>1,则认为是螺旋核。然后从螺旋核向两端延伸,直至四肽片段Pα的平均值小于1为止。按上述方式找到的片段长度大于5,并且Pα的平均值大于Pβ的平均值,那么这个片段的二级结构就被预测为α-螺旋。

β折叠

如果相邻6个残基中若有4个残基对应的Pβ>1,则认为是β-折叠核。折叠核向两端延伸直至4个残基Pβ的平均值小于1为止。若延伸后片段的Pβ的平均值大于1.05,并且Pβ的平均值大于Pα的平均值,则该片段被预测为β-折叠。