夏金梅 ;吴晓建; 元英进
天津大学化工学院制药工程系
Metabolomics data mining method: WT-HCA
XIA Jinmei;WU Xiaojian;YUAN Yingjin
摘要:
针对现有的代谢物组学信息挖掘方法存在的问题,尝试将小波分析(wavelet analysis)与无导式模式识别手段等级聚类分析(hierarchical clustering analysis, HCA)相结合,整合小波分析在频域去噪及信息提取的能力和等级聚类分析客观性强的特点,建立了小波变换-等级聚类分析(wavelet transform-hierarchical clustering analysis, WT-HCA)方法。以文献拟南芥代谢物组数据为例,考察了所建立方法提取代谢物组信息的能力。结果表明,WT-HCA方法可以有效地提取代谢物组信息。在系统默认距离定义方案下,WT-HCA方法能将亲本两类样品完全分开,而HCA方法基本不能将样品区分开;在另一种距离定义方案(样品间距离为欧氏距离,类间距离为离差平方和距离)下,WT-HCA方法将4类样品中的3类完全正确归类,总的分类正确率达到了93.75%,显著高于HCA所得到的84.375%的总体分类正确率。