视频字幕
GNPS是全球天然产物社交分子网络平台的简称,它是一个基于质谱数据构建分子网络的在线平台。该平台的核心原理是通过比较二级质谱图的相似性,将结构相似的分子连接成网络,从而帮助研究人员发现和鉴定天然产物。
分子网络的构建基于MS/MS谱图的相似性比较。首先获取各分子的碎片离子信息,然后使用余弦相似度公式计算谱图间的相似性。当相似度超过设定阈值时,通常是0.6以上,就将这些分子连接为网络中的节点。
分子网络的构建是一个系统性过程,包括数据预处理、谱图匹配、相似度计算、网络拓扑构建和节点注释等步骤。这种方法具有显著优势,能够发现未知化合物,揭示代谢途径,批量注释分子结构,并可视化分子间的关系。
总结一下GNPS分子网络平台的核心内容:该平台基于MS/MS谱图相似性构建分子网络,使用余弦相似度算法比较谱图碎片模式,将相似分子通过网络连接展示其结构关系,这种方法在天然产物发现和代谢途径研究中具有重要价值。
GNPS平台的第一步是数据输入与预处理。用户需要上传MGF格式的质谱数据文件,其中包含MS/MS谱图信息、前体离子质量和碎片离子数据。平台会对输入数据进行质量控制和去噪处理,确保后续分析的准确性。
谱图比对是分子网络构建的核心步骤。系统会两两比较所有MS/MS谱图,使用余弦相似度算法计算得分,同时考虑前体离子质量差异。通过设定关键参数如最小相似度阈值、匹配峰数和质量容差来过滤和优化网络连接。
网络构建的最终步骤是将每个MS/MS谱图表示为节点,在相似谱图间绘制连接边,形成分子家族聚类。节点大小可以反映分子丰度,通过谱库匹配和结构预测方法对网络进行注释,从而实现分子鉴定和代谢途径分析。
总结GNPS分子网络构建的核心原理:该平台基于MS/MS谱图相似性,通过余弦相似度算法比较碎片模式,设定合适的阈值参数来过滤和优化网络连接,最终实现分子家族聚类和结构注释,为天然产物发现和代谢途径研究提供了强有力的分析工具。