中文
ENGLISH
于长斌研究团队提出基于离子熵的新方法 提高代谢组学注释的可靠性

时间:2024年03月08日

地点:

山东第一医科大学医学人工智能与大数据学院院长于长斌的研究团队最近提出了一种基于离子熵的新颖方法,旨在提高代谢组学数据的注释质量和假阳性发现率(FDR)估计的准确性。该工作的研究成果发表在期刊《Briefings in Bioinformatics》上,题为Ion entropy and accurate entropy-based FDR estimation in metabolomics。


代谢组学通过检测生物样本中大量代谢物的存在及其浓度水平,为细胞内发生的生物化学过程提供功能性解读。准确的代谢物标注和可靠的FDR控制对于从海量代谢组数据中获得有意义的生物学发现至关重要。然而,由于小分子代谢物结构多样性和碎裂复杂性,为质谱数据注释生成假阳性代谢物数据库一直是一大挑战。


研究人员基于信息论中的熵概念,提出了离子熵作为一种新的度量指标,用于量化质谱数据库中碎裂离子的信息含量。通过评估公共代谢组数据库,他们证实了离子熵有效描述了离子信息的丰富程度和多样性。




在此基础上,研究团队设计了两种基于熵的新方法生成高质量的假阳性代谢物数据库,用于FDR估计。经过与现有主流方法的全面评估和公共数据集的验证,基于离子熵的策略展现出优越的FDR评估精度,尤其是在关键的低FDR区间(0-0.1)。


该工作为代谢组学中的假阳性发现率控制提供了有力的熵理论框架。研究人员指出,借助不断增长的公共质谱数据库资源,离子熵有望为探索分子碎裂规律、评估数据库质量等带来新的见解。总体而言,该研究有助于提高大规模代谢组分析的可靠性,推动代谢组学在生物医学研究中的应用。


该项工作得到了山东省自然科学基金(2022HWYQ-081)的资助。于长斌教授为团队的课题负责人,山东第一医科大学医学人工智能与大数据学院院长,研究方向为临床和生物数据的人工智能算法以及网络控制系统。安绍维等人是论文的第一作者和主要参与人员。


论文链接:https://academic.oup.com/bib/article/25/2/bbae056/7615970