|
南京航空航天大学学报 2018
基于加权朴素贝叶斯分类器和极端随机树的蛋白质接触图预测DOI: 10.16356/j.1005-2615.2018.05.006 Abstract: 提出一个新的基于集成学习的预测器(TargetPCM),对蛋白质接触图(特别是中长程)进行高精度的预测。首先,TargetPCM使用加权朴素贝叶斯分类器(Weighted Na?ve Bayes classifier,WNBC)融合3个接触图预测器的输出,其中WNBC中的权重参数通过粒子群算法优化得到;其次,将WNBC融合后的输出和基于序列的特征进行组合,得到更具鉴别能力的特征;在此基础上,应用极端随机树训练得到最终的蛋白质接触图预测模型。为了验证TargetPCM的有效性,在包含98个非冗余蛋白质的数据集上进行了测试。结果表明:对于短程、中程和长程接触,TargetPCM的Top L/5精度比现有最好的集成预测器(NeBcon)分别提高了8.2%,16.1%和5.3%。在CASP11上进一步的验证表明,对于短程、中程和长程接触,TargetPCM的Top L/5精度比现有最好的基于协同进化的集成预测器(MetaPSICOV)分别提高了7.4%,9.1%和7.5%。实验结果验证了本文所提蛋白质接触图预测方法的有效性。
|