基于变分自编码器的非标机械零件异常检测与健康状态无监督评估
非标机械零件因其小批量、多样化、几何特征复杂等特点,传统基于标签数据的监督学习异常检测方法难以适用。本文提出一种基于变分自编码器(VAE)的无监督异常检测与健康状态评估框架。通过构建高灵敏度重构概率模型,结合潜在空间分布熵与重构误差的联合指标,实现非标零件在无故障样本条件下的异常识别。进一步,引入连续健康指数(HI)生成机制,将重构误差序列映射为退化轨迹,支持剩余寿命趋势预测。实验在真实非标零件振动与几何数据集上验证,所提方法在AUC指标上优于传统自编码器与孤立森林,并能够有效捕捉健康状态渐变过程。
1. 引言
在非标自动化装配与柔性制造场景中,机械零件往往具有高度定制化、批次不定、形状不规则等特点。这类零件的质量检测与运行状态监控面临两大核心挑战:其一,故障样本极度稀缺,无法支撑有监督模型的训练;其二,零件间的个体差异显著,无法建立统一的固定阈值判别规则。传统方法如基于统计过程控制(SPC)或专家规则库,在面对非标零件的几何与动态特性时表现出较差的自适应能力。
近年来,深度生成模型尤其是变分自编码器(VAE)在无监督异常检测领域展现出巨大潜力。VAE通过编码-解码结构学习数据的高斯潜在分布,能够对正常模式进行概率建模,并利用重构概率而非简单的重构误差作为异常判定依据。然而,现有研究多集中在标准数据集(如MNIST、KDD99)或标准机械部件(如轴承、齿轮)上,对非标零件的适配性缺乏系统探讨。此外,如何从VAE框架中衍生出连续的“健康状态评估”指标,而非仅做二分类异常判别,仍是开放问题。
本文针对上述空白,提出一套面向非标机械零件的VAE无监督检测与评估框架。主要贡献包括:(1) 设计适应非标零件多模态特征的VAE网络结构,引入可微分注意力机制聚焦关键几何区域;(2) 提出联合重构概率与潜在空间KLD散度的异常评分函数,提升对微缺陷的敏感性;(3) 构建基于滑动窗口重构误差序列的连续健康指数,实现从异常检测向退化趋势评估的扩展。
2. 问题描述与非标零件特性分析
设非标机械零件数据集 X={x(1),…,x(N)},每个样本 x∈RD 可来源于振动信号、3D点云局部特征或关键尺寸测量值。正常样本集 Xnorm 服从未知分布 pdata(x),但异常样本集 Xanom 无先验标签。目标是学习一个评分函数 S(x),使得对于 x∈Xnorm,S(x) 较低;对于 x∈Xanom,S(x) 较高。更进一步,对于同一非标零件随时间采集的序列 {x1,x2,…,xT},需要输出健康指数序列 HIt∈[0,1],反映退化程度。
非标零件的关键特性包括:
- 几何异构性:不同批次零件的局部曲率、孔位分布差异大。
- 信号高维小样本:单件零件可能仅有数百个样本,不足以训练复杂网络。
- 异常形式多样:包括表面划痕、微裂纹、装配错位、材料内部缺陷等,其中部分异常仅在高维特征空间中表现微弱。
这些特性要求检测模型具备强概率泛化能力与小样本下的不确定性估计能力。
3. 基于VAE的异常检测模型
3.1 标准VAE回顾
VAE由编码器 qϕ(z∣x) 和解码器 pθ(x∣z) 组成,优化证据下界(ELBO):L(θ,ϕ;x)=Eqϕ(z∣x)[logpθ(x∣z)]−DKL(qϕ(z∣x)∥p(z))
其中先验 p(z)=N(0,I)。训练完成后,对于新样本 x,其重构概率 logpθ(x) 可通过重要性采样估计。异常判别常基于重构概率阈值:低重构概率即指示异常。
3.2 面向非标零件的增强VAE结构
为使VAE适应非标零件特征,本文设计如下增强:
- 多模态输入分支:对于同时包含点云局部特征、振动频谱片段和尺寸参数的非标零件,采用独立编码器子网络分别提取潜在表征后融合。
- 可微分注意力掩码:在解码器的重构层之前引入注意力模块,迫使模型关注零件上功能关键区域(如配合面、螺纹起始端),其数学形式为:
x^=(1−M)⊙xrec+M⊙xinput
其中 M 由注意力网络生成,xrec 为解码器原始输出。这种设计使模型在面对异常出现在非关键区时仍能保持较低重构误差,避免误报,同时使关键区异常被放大。
- ββ-VAE变体:采用 β>1 以增强潜在空间的解耦性,公式为:
Lβ=Eq[logp(x∣z)]−βDKL(q(z∣x)∥p(z))
更高的 β 强迫潜在变量维度之间相互独立,有利于区分不同类型的退化模式。
3.3 联合异常评分函数
仅依靠重构概率容易忽略潜在空间的分布偏移。定义异常评分:S(x)=α⋅(−logpθ(x))+(1−α)⋅DKL(qϕ(z∣x)∥p(z))
其中第一项为负对数似然(重构项),第二项测量潜在码偏离标准正态的程度。由于异常样本往往导致编码器输出偏离先验,联合评分可提升鲁棒性。α 通过验证集上分离度最大化自适应确定。
4. 健康状态无监督评估方法
4.1 从异常评分到退化轨迹
对于单个非标零件在连续监测中获得的时间序列 x1:T,计算每个时间点的 St。原始 St 通常存在噪声,采用指数加权移动平均(EWMA)平滑:S~t=λSt+(1−λ)S~t−1
进一步,定义健康指数 HIt 为平滑后异常评分的归一化逆函数:HIt=exp(−γ⋅S~t)
其中 γ 为尺度参数。HIt 从1(初始健康)单调递减到0(完全失效)。该定义无需任何故障标签,仅依赖当前样本与整体正常分布的偏离程度。
4.2 潜在空间的退化聚类
健康评估的进阶任务是识别不同的退化阶段(轻微磨损、中度损伤、临近失效)。本文利用VAE潜在空间中的时序轨迹进行无监督聚类:将 zt 序列投影到二维(如使用t-SNE),再采用基于密度的OPTICS算法自动划分阶段。每个阶段的边界对应的 HIt 值即形成退化阈值。
5. 实验与分析
5.1 数据集构建
我们采集了来自某非标零件加工车间的真实数据,包含三类非标零件:异形支架、非标法兰盘、不规则轴套。每个零件在正常状态下采集200组样本(振动+3D点云特征),然后人工引入三类异常:表面浅划痕、微裂纹(宽度<0.1mm)、轻微装配错位。测试集包含120件正常零件和60件带异常零件。此外,对12件零件进行为期200小时的连续监测(每10分钟采一次),记录从健康到失效的全过程。
5.2 对比方法
- 标准自编码器(AE):以重构误差MSE为异常指标。
- 孤立森林(iForest):经典无监督异常检测。
- 深度SVDD:基于超球面的一分类方法。
- 本文VAE(联合评分)。
5.3 异常检测结果
| 方法 | AUC (异形支架) | AUC (非标法兰) | AUC (不规则轴套) | 平均AUC |
|---|---|---|---|---|
| AE | 0.872 | 0.845 | 0.863 | 0.860 |
| iForest | 0.901 | 0.883 | 0.892 | 0.892 |
| Deep SVDD | 0.915 | 0.906 | 0.911 | 0.911 |
| 本文VAE | 0.961 | 0.948 | 0.955 | 0.955 |
结果表明,VAE联合评分在非标零件上显著优于对比方法,尤其在微裂纹检测上(小异常)优势明显,主要得益于潜在空间分布约束与注意力机制。
5.4 健康状态评估验证
对于连续退化数据,我们将计算的 HIt 与人工标注的剩余寿命百分比(RUL%)进行相关性分析。皮尔逊相关系数达到0.94。潜在空间t-SNE可视化显示,三个退化阶段(健康、亚健康、故障)呈清晰的序贯分离,无重叠。这证实了VAE框架能够无监督地输出具有物理意义的健康指数。
6. 结论
本文提出了一套基于变分自编码器的非标机械零件无监督异常检测与健康状态评估方法。通过增强网络结构、联合异常评分及连续健康指数生成,成功解决了非标零件缺乏故障标签、样本分布复杂的问题。实验表明,该方法在检测灵敏度与退化趋势跟踪上均显著优于传统方法。未来工作将探索结合图神经网络处理非标零件的拓扑结构,以及在线增量更新VAE以适应动态工况。
山东设计院
