张贵军教授课题组在美国科学院院报《PNAS》发表研究成果
作者:控制学科
发布日期:2019-07-25
浏览次数:
近日,我院控制科学与工程学科张贵军教授课题组在结构生物信息学研究中取得重要进展。研究成果“Assembling multidomain protein structures through analogous global structural alignments”以直接投稿方式发表在美国科学院院报《PNAS》上。该论文以浙江工业大学为第一作者和通讯作者单位。课题组毕业博士研究生周晓根博士为论文第一作者,张贵军教授为论文共同通讯作者。 周晓根博士为课题组2018级博士毕业生。2012年考入浙江工业大学信息学院攻读硕士学位(导师为张贵军教授);2015年转为直接攻读博士学位(导师为俞立教授和张贵军教授);2016年10月获CSC项目资助,赴密西根大学进行为期一年的联合培养(联合培养导师为张阳教授);2018年至今,在张阳教授实验室开展博士后研究工作。该项工作是与美国密西根大学张阳教授团队共同合作的结果,张阳教授为该论文共同通讯作者。 蛋白质的结构决定其生物学功能。生物体中蛋白质均以一种极其复杂的分子结构存在,一旦蛋白质折叠错误,就会导致糖尿病、帕金森症和阿尔茨海默病等疾病。蛋白质结构预测是《科学》杂志指出的21世纪125个具有挑战性的科学前沿问题之一。预测蛋白质结构意义重大,它会对健康、生态、环境产生重大影响,并能够应对蛋白质设计、疫苗研发等生命系统基本问题。 信息技术、计算机技术、人工智能技术与生命科学领域的深度交叉融合,将会有效地驱动和加速科学新发现。研究工作从目标蛋白质结构域出发,构建了多域蛋白质库,基于结构比对方法获得全局模板;考虑物理势能因素,基于数据挖掘技术提取模板距离谱特征,设计打分能量函数;进而基于计算智能方法搜索获得低能结构;最后通过侧链精修、结构域铰链区重建,得到目标蛋白质的全长结构。多域蛋白质测试集上的测试结果表明,86%的连续域蛋白质和100%的不连续域蛋白质可以组装得到正确的全局结构。这一个研究进展将有助于缩短目前基因组序列数量和实验测定结构数量之间的鸿沟,满足结构生物社区对多域蛋白质结构预测日益增长的需求。该篇论文的发表,标志着课题组在结构生物信息学多域蛋白质结构预测领域的相关前沿性研究工作受到了国际同行的认可和广泛关注。 图1:多域蛋白质组装流程图 图2:不同方法实验测定的结构域组装结果对比。(A) 该工作(DEMO)与AIDA(目前唯一可行的多域蛋白质组装方法)的TM-score(结构得分)对比;(B) DEMO与Modeller的TM-score对比;(C) DEMO、AIDA和Modeller的TM-score箱线对比图;(D) 不同iRMSD(接触面均方根误差)阈值下蛋白质的百分比,(a)-(d)分别表示2个连续域(2dom)、3个连续域(3dom)、4个及以上连续域(m4dom)、1个连续域和1个不连续域(2dis)蛋白质的结果。
《PNAS》是美国国家科学院的院刊,亦是公认的世界四大名刊(Nature,Science,PNAS, Cell)之一,百年经典期刊。自1914年创刊至今,PNAS提供具有高水平的前沿研究报告、学术评论、学科回顾及前瞻、学术论文以及美国国家科学学会学术动态的报道和出版。
原文链接:https://www.pnas.org/content/early/2019/07/23/1905068116 本研究得到了国家自然科学基金项目(61773346)支持。
|