摘要:
针对特征选取问题中的信息测度-互信息在高维空间下难以计算的问题,在高维特征空间输入特征信息均匀分布的假设下,推导出了一个估计候选特征与输出类别之间在给定已选特征子集情况下的条件互信息计算公式,可以在特征信息不严重背离均匀分布的情况下对特征进行有效评价,并据此提出了一种新的特征选取算法——基于二阶互信息的特征选取算法。该算法能够自适应估计出候选特征与已选特征之间关于输出类别的冗余信息,而无须像MIFS方法那样需要预先人为设定与特征冗余程度有关的参数,提高了算法的性能。TE过程模型的仿真实验结果表明,算法能够提供准确的特征评价准则,具有较高的故障诊断准确率。