基于N-gram相似度增强蛋白质肽段组装的方法

——面向质谱数据分析

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要:蛋白质肽段组装是确定蛋白质全长序列的重要步骤之一。然而,由于测序数据的不完整性及测序错误,传统de Bruijn图方法ALPS在肽段组装中存在覆盖率低和准确率不足的问题。因此,文章提出了一种基于N-gram相似度增强肽段组装的方法。利用N-gram算法改进了ALPS方法的组装路径选择,通过计算肽段子串之间的相似性,对de Bruijn图中断裂子串处进行容错性补充,从而提升了肽段组装序列的覆盖率与BLAST比对的得分。(剩余10761字)

目录
monitor