OpenPepXL:一种用于灵敏鉴定XL-MS中交联肽的开源工具
收藏
时间:2021-03-29 12:40:32作者:多肽A梦阅读:5201 交联MS(XL-MS)被公认为是有关蛋白质结构和相互作用的有效信息来源。与常规的肽鉴定相比,XL-MS必须处理二次搜索空间,其中每种蛋白质的肽都可能与任何其他蛋白质交联。为了应对这个搜索空间,大多数工具都采用了不同的启发式方法来减少搜索空间。我们引入了一种新的开源XL-MS数据库搜索算法OpenPepXL,与其他工具相比,该算法提供了更高的灵敏度。OpenPepXL可以搜索XL-MS实验的整个搜索空间,而无需使用启发式方法来减少它。由于高效的数据结构和内置的并行化功能,OpenPepXL可以实现出色的运行时,并且还可以部署在大型计算集群和云服务上,同时保持较小的内存占用。我们将OpenPepXL与其他几种常用工具进行了比较,这些工具可用于在各种XL-MS实验中鉴定不可裂解的标记和无标记交联剂。在我们的第一个比较中,我们使用了一部分细胞裂解液的数据集,并带有一个包含128个靶标和128个诱饵的蛋白质数据库。在FDR为5%的情况下,OpenPepXL发现的独特残基对(URP)比其他工具多7%至50%以上。在具有可用于交叉链接验证的高分辨率结构的数据集上,OpenPepXL报告的经过结构验证的URP比其他工具多了7%至40%以上。此外,我们使用了合成肽数据集,该数据集可在不依赖结构信息的情况下进行交叉链接的客观验证,并发现OpenPepXL报告的经过验证的URP比其他工具至少多12%。它已构建为OpenMS工具套件的一部分,并支持Windows,macOS和Linux操作系统。OpenPepXL还支持XL-MS识别结果的MzIdentML 1.2格式。根据三项BSD许可,可在以下位置免费获得该文件:https://openms.org/openpepxl。
公众号内回复“XLMS”,自动获取PDF原文链接。
交联质谱(XL-MS)已被证明是研究蛋白质的结构和相互作用的有价值的工具。尽管XL-MS已经成为一种非常有用的方法,但是在工作流程的每个步骤中都有改进的空间。特别是衍生自交联蛋白样品的交联肽的富集步骤对XL-MS分析以及随后的计算鉴定和MS2批注的FDR统计数据具有深远的影响。在许多XL-MS实验中,样品仍包含大量未交联的样品,即线性肽;因此,交联的肽通常以低强度出现,因此也不太可能在依赖数据的采集中被选择用于片段化。因此,必须在来自未修饰肽的大量光谱中识别出相对较少的交联的前体和片段光谱。与线性肽段的鉴定相比,这是使后处理和过滤XL-MS数据的统计数据更加困难的问题之一。
交联肽的片段光谱也更难以注释,因为它们包含来自两个肽的片段。对整个交联片段光谱匹配进行评分可能会导致鉴定,其中一个肽序列被许多片段离子覆盖,而第二个肽则通过其前体质量和仅很少的匹配片段离子被鉴定。肽序列之一的可靠鉴定不依赖于另一序列的正确鉴定。在数据库搜索中可以识别出具有高分的交联肽对,其中高分是基于与一个正确肽的合法良好匹配,但与第二个肽不匹配。可靠地识别交联键,可用于建模蛋白质结构或复合物,
在每个片段谱图中搜索两个肽段对XL-MS识别软件的性能也有影响。对于常规基于MS的蛋白质鉴定中的给定前体质量,可以通过应用``平均''模型粗略估计可能匹配的线性肽的长度。在数据库搜索中要考虑用于匹配肽的候选物的数量主要取决于前体质量公差窗口的宽度和蛋白质数据库的大小。在XL-MS中,质量分布在两个肽之间,只有它们的质量之和加上交联剂的质量之和才是已知的。计算搜索空间包含质量总和位于前体质量窗口内的交联肽的所有可能组合。搜索肽的所有组合,而不仅仅是线性扫描所有肽,需要有效的算法来在可接受的时间范围内执行搜索。
原文链接:https://www.mcponline.org/article/S1535-9476(20)60018-4/fulltext
QQ客服
联系电话
微信客服
打开微信扫一扫
在线留言
回到顶部