南加利福尼亚大学生命科学部教授孙丰株应邀做客巴斯德讲坛

  

201854日,南加利福尼亚大学生命科学部教授孙丰株应邀做客中国科学院上海巴斯德研究所“巴斯德讲坛”,作了题为“Statistical and Computational Approaches for the Identification of Novel Viruses and Virus-host Interactions”的精彩报告。讲坛由郝沛研究员主持。

VirHost-Matcher开发的启发下,孙丰珠采用k-mer频次统计学习病毒序列特点,开发了病毒发现算法VirFinder。目前的病毒鉴定方法主要通过与病毒核酸和蛋白质数据库比较,根据基因相似性鉴定病毒。一方面这些算法依赖于已知的病毒序列,而目前已知的病毒序列非常有限,另一方面,病毒基因序列只是病毒序列的一部分,不足以表征整个病毒基因组特征。为解决这些问题,孙丰珠团队应用k-mer频次统计对全长病毒序列进行编码,并采用机器学习算法学习病毒序列特征,建立病毒序列预测模型,进行病毒序列预测。算法性能比较实验证明,该算法比现有病毒鉴定算法更准确高效,如比Virsorter(目前病毒鉴定的代表性算法)的阳性发现率高78倍(1Kbp内),而假阳性率跟Virsorter相当。

“巴斯德讲坛”(Pasteur Colloquium)是为弘扬路易·巴斯德科技创新服务社会的精神,由上海巴斯德所主办,定期邀请微生物学、病毒学、免疫学、疫苗学、流行病学专业领域国内外知名科学家,开展集科学性、前瞻性、开放性于一体的科研讲座。本次讲座是2018年举办的第9期讲座。