基于预测性维护模型的离心泵故障诊断_山东博泵科技股份有限公司

基于预测性维护模型的离心泵故障诊断

基于预测性维护模型的离心泵故障诊断泵沙龙 2026年1月13日 07:04

随着先进分析工具与机器学习技术的广泛应用，基于预测性维护模型对设备运行状态进行持续监测已成为可能。

Marialuisa Menanno Post Doc in Industrial Engineering University of Sannio Benevento, Italy

摘要：随着流程自动化需求的持续增长及工业4.0的深入推进，预测性维护策略日益受到重视。该策略能够依据设备的实际运行状态执行维护任务，有助于降低因停机造成的成本，并显著提升生产设备的运行效率与可用性。随着先进分析工具与机器学习技术的广泛应用，基于预测性维护模型对设备运行状态进行持续监测已成为可能。本研究提出一种面向制造领域的机器学习预测模型方法，采用监督学习框架，结合滑动窗口处理技术与支持向量机（SVM）算法，模型准确率达到99.7%。该算法基于声学与振动参数对离心泵运行状态进行监测，能够有效识别并预测其五种不同运行状态，为智能制造场景下的预测性维护提供了可行路径。广告重磅！各省高级工程师职称评审全面放开！满足2点要求可评高级以正科技教育了解更多关键词：预测性维护；机器学习；离心泵；制造领域；滑动窗口

引言

维护是一项涉及多种行动与策略的复杂活动。以纠正性维护为例，该方式仅在故障或失效发生后采取应对措施。尽管此类维护在初期不会产生明显成本，但可能引发长时间的生产中断，从而对企业运营造成显著影响。相比之下，预防性维护则属于一种主动策略，其目标是通过在预定时间间隔或基于设备使用强度安排计划性工作，以防范设备损坏。该策略具有多重优势，包括优化工作组织方式、有效管理停机时间以及改善生产流程。然而，预防性维护也可能导致维护成本上升，部分投入在经济效益上未必具备充分合理性。预测性维护同样属于主动维护策略，它通过持续监测振动、温度、能耗、液位等运行参数，分析设备状态并预测未来可能发生的故障。实施预测性维护有助于提高生产效率、优化成本结构，并减少不必要的干预。该策略能够显著降低因潜在故障和非计划停机所带来的风险。在工业生产所使用的各类机械设备中，离心泵具有广泛的应用价值，其使用场景覆盖食品加工、供水和污水处理等多个领域。作为通用性较高的泵型，离心泵常因流体问题（如汽蚀）以及机械部件故障（如轴承和密封件损坏）而导致运行异常。振动监测是识别泵内部故障的有效手段之一。为预防设备损坏，可利用相关传感器数据对其运行状态进行实时监测，并据此制定高效的维护策略（McKee K. 等人，2011年）。近年来，人工智能算法在预测性维护中的应用显著增强了维护工程师的技术能力。此类算法能够辅助工程师分析传感器数据、识别异常状况，并在机器发生故障前安排有效干预。通过研究复杂运行现象并确定维护行动的最佳时机，预测性维护技术已受到广泛关注。该方法不仅能预测潜在故障，还可评估忽略特定干预措施可能引发的后果，从而以相对较小的投入实现显著的运维效益。机器学习技术通过有效利用传感器数据，为实现预测性维护提供了关键支撑。其应用有助于降低生产成本、缩短生产周期、并提升工作场所的安全性（Carvalho等人2019年）。机器学习算法基于数学方法处理输入信息，并具备自适应学习能力，能够随着数据集的不断积累持续优化性能。本研究旨在通过同步分析离心泵电机的声学与振动这两类特征参数，探究设备故障的可预测性。我们提出了一种基于机器学习的新方法，能够融合来自声学与振动传感器的数据，从而全面评估设备状态、判断预测性维护需求、确定适用的工作类型，并精准识别五种典型故障配置中即将发生的具体故障类型。这些人工智能技术的运用实现了高效可靠的设备监测，有助于显著降低维护成本与停机时间。本文的结构安排如下：第二部分为文献综述，第三部分阐述所采用的研究方法，第四部分详细介绍案例研究的设计与实施，第五部分对所得结果进行分析与讨论。最后，第六部分总结全文，指出本研究的主要局限，并对未来研究方向提出建议。

文献综述

多位学者已针对机器学习在预测性维护领域的应用展开深入研究。例如，Mallouk 等人（2021年）开发了一种基于监督学习的预测模型，通过比较不同回归算法来预估危险品运输卡车轮胎的剩余行驶里程。Fernandes 等人（2020年）采用机器学习算法，实现了最长可提前七天的锅炉故障预测。Calabrese 等人（2020年）运用预测性维护方法，结合对海量日志数据的分析，完成了对多台互联设备的同步监控。 DeShong 等人（2022年）应用机器学习技术，分析旋转涡轮叶片表面温度测量值，以评估局部薄膜冷却速率的变化。Tan 等人（2022年）提出了一种集成学习方法，结合多尺度视网膜与颜色恢复（IMSRCR）技术与YOLO 系统，基于隧道内部图像数据实现螺栓腐蚀检测。Chung 等人（2023年）依据检测数据与维护报告，对半导体制造设备进行正常运行时间预测，并完成了故障的有效分类。Nuhu 等人（2023年）则在半导体制造过程中实施了基于机器学习的故障诊断机制。 Yuan 等人（2023年）提出采用支持向量机（SVM）算法实现分子泵的故障检测；而Sridevi 和 Bothra（2022年）则聚焦于铅酸蓄电池，构建了一种基于机器学习算法的预测性维护模型。此外，机器学习在离心泵损伤检测方面展现出重要的应用潜力。Mousmoulis 等人（2017年）通过分析三种不同叶轮在汽蚀过程中的流动图像、振动信号与声发射数据，验证了使用声发射传感器与加速度计检测汽蚀初期的可行性。Gao 等人（2019年）针对轴向柱塞泵开展了快速故障诊断研究，结合振动分析以及沃尔什变换去噪与 Teager 能量算子解调的混合方法，提升了诊断效率。 Gonçalves 等人（2021年）通过利用从振动数据中提取的马尔可夫参数作为特征，结合基于凸优化的分类算法，对离心泵中的汽蚀故障进行了评估。Azadeh 等人（2013年）提出了一种灵活的泵状态分类算法，融合支持向量机超参数优化与人工神经网络技术，其研究表明，结合遗传算法和粒子群优化的混合模型可显著提升支持向量分类器的性能。Hasan 等人（2021年）则提出了一种用于离心泵自动化健康诊断的框架，该方法结合了基于连续小波变换（CWT）尺度图的成像技术与自适应深度卷积神经网络（ADCNN）。 Manikandan 等人（2023年）专注于工业单体离心泵的故障诊断，采集了包括健康状态、叶轮损坏以及密封在内的三种配置下的振动信号。通过将模拟信号转换为二维图像，并采用深度卷积神经网络（DCNN）分类器进行故障预测，最终实现了99.07%的准确率。 Orrú 等人（2020年）开发了一种初步的机器学习模型，用于分析来自石油和天然气行业离心泵上安装的温度、压力和振动探头所采集的真实历史数据。该研究采用支持向量机（SVM）和多层感知器（MLP）算法来识别并分类潜在故障。与此同时，Yen 等人（2020年）则利用基于 WaveNet 的自编码器，对泵的历史振动数据进行分析，从而评估其性能退化情况。 Kumar 等人（2020年）基于同一数据集，借助声学数据分别采用机器学习和深度学习方法进行泵缺陷检测。在机器学习模型中，支持向量机实现了93%的准确率，人工神经网络为86.4%，自适应神经模糊推理系统（ANFIS）为84.8%；而在深度学习系统中，传统卷积神经网络（CNN）取得了96.8%的准确率，进一步通过损失函数优化后的改进CNN模型更是达到了100%的准确率。综合现有研究可见，将振动与声学数据相结合，并应用于预测性维护与人工智能分析的研究仍相对有限。因此，本研究旨在通过分析声学与振动数据，对制造行业中泵叶轮或轴承的潜在故障进行有效预测。

问题研究与方法

机器学习作为人工智能的一个关键分支，致力于使计算机系统能够从经验中学习，并随着时间的推移持续提高其性能。通过向机器输入数据集并运用特定算法进行处理，机器学习使系统能够形成一种执行特定功能以实现预定目标的推理机制。该类算法可广泛应用于分类、聚类、转写、机器翻译及异常检测等多种任务。在预测性维护领域，机器学习方法为防止生产线设备故障提供了颇具前景的解决方案。它们能够揭示数据中复杂的内部关联，这些关联若依赖传统工具可能难以捕捉。基于机器学习的技术不仅能够检测迫近的故障，还可对机器状态做出更精准的预测（Wagner 等人，2016年）。本研究采用的方法包括四个主要步骤，如图1所示。

图1：基于多类分类的故障预测过程 1. 数据收集：本研究使用的数据集来源于IEEE科学数据平台，具体由Anil Kumar与Rajesh Kumar （2022年）提供。 2. 数据准备：在进行分析之前，由于原始数据集存在信息缺失、大量文本数据及结构混乱或含有噪声干扰等问题，需进行预处理。为此，我们实施了多种数据预处理操作。在本案例研究中，为提升准确性、降低延迟并优化计算成本，采用了滑动窗口方法。该方法通过按样本逐次移动一个固定长度的窗口，并对窗口内数据进行统计计算来实现。窗口长度的选择直接影响用于统计建模的数据段范围，因此确定滑动窗口参数（k）的最佳尺寸对模型性能至关重要。本研究通过多次实验，评估了参数k的五个不同取值以寻求最优配置。 3. 选择性能最佳的模型：本研究基于Rao等人（2019年）描述的框架，采用以下两种机器学习范式： 1）无监督学习：该技术旨在识别输入数据中隐藏的结构或未知类别，适用于无标签数据集，其中聚类是常用方法之一。 2）监督学习：该方法利用已知的输入-输出数据构建预测模型，以对新输入进行输出估计。监督学习主要包括两种技术：

a. 分类：用于预测离散的输出标签，通过将数据划分到预设类别中实现； b. 回归：用于预测连续的输出值，适用于输出为实数的问题场景。

算法选择需结合具体问题而定，并不存在一种适用于所有场景的通用最优机器学习算法。在本案例中，预测分析采用监督学习下的分类方法，所使用的具体算法及其默认参数如表1所示。表1：所选算法及其默认参数值

通过该模型，可根据输入数据输出反映泵运行状态的分类结果。所选分类模型的训练与评估数据集被划分为三个部分： 1）训练集：用于训练预测变量，直至模型达到预期性能。 2）验证集：在训练过程中用于监控和调整模型性能。 3）测试集：用于对模型进行最终评估。该部分由模型训练过程中未接触过的真实数据构成，能够全面检验模型的端到端性能。评估过程采用基于混淆矩阵的相关指标（如准确率）以及ROC曲线进行分析。所提出的研究方法可进一步应用于预测阶段，从而实现对离心泵故障可靠且高效的诊断。

案例研究

为验证所提出方法的有效性，本研究选用了一台CRI品牌的单体离心泵，具体型号为ACM-0 (AF)，该泵在43 Hz的频率下运行（如图2所示），工作电压为230/240V，由一台额定功率为373 W的电机驱动，其排水能力为1.61 L/s，扬程为9 m。泵内装有三个直径为119 mm的旋转叶轮。该泵安装在如图2所示的测试台架上，测试台架设有一个由两个轴承支撑的转子。最靠近叶轮的轴承型号为6203ZZ，其节圆直径为28.5 mm，滚珠直径为6.74 mm，共含8颗滚珠，接触角为0°。

图2：试验台架 1. 传感器与数据采集设备为采集泵电机运行时的振动与声学信号，测试台架上安装了两个传感器，并连接至一台便携式数据采集设备。声学信号通过麦克风（ECM8000）采集，而振动数据则由单轴加速度计（PCB 353B34）测量。所选用的数据采集设备为NI-USB-4431，这是一款24位、4通道的模拟I/O数据采集卡，专用于高精度信号采集。振动信号的采样频率设定为70 kHz。该设备提供四个输入通道，可测量电压范围为±10 V的信号。 2. 泵的数据集与故障模拟方案实验共设置了5种不同的运行配置，见表2。表2：实验配置列表

针对每种泵的状态配置，分别通过声学传感器和振动传感器采集了1,048,575个测量值，采样频率为70,000 Hz。该数据集由Anil Kumar和Rajesh Kumar（2022年）提供，总共包含1,048,575 × 5条声学信号和1,048,575 × 5条振动信号。 3. 数据处理在预处理阶段，采用滑动窗口方法对声学与振动数据进行处理。针对五种泵状态（无缺陷、叶轮破损、叶轮堵塞、轴承内圈缺陷、轴承外圈缺陷）对应的声学数据，按参数"k"进行窗口划分。对每个窗口内的"k"个数据点，计算其均值、最小值、最大值和标准差。该过程基于70,000 Hz采样频率，对不同"k"值重复进行。振动数据遵循相同的处理流程。随后，将每个"k"值对应的处理结果组织为一个九列矩阵。其中，第1至4列为声学传感器数据的统计特征（均值、最大值、最小值、标准差），依次对应五种状态配置；第5至8列为振动传感器数据的相应统计特征，排列顺序与声学数据一致；第9列为状态标识，具体对应关系如表1所示。所选 k 值及对应的矩阵维度如表3所列。表3：不同k值对应的矩阵维度

4. 最佳性能模型的选择为从不同"k"值处理得到的五个矩阵中选取最优模型，本研究采用分类法进行预测分析，目标是根据振动和声学信号将离心泵状态识别为表3所列类别之一。针对每个矩阵，我们测试了多种分类算法，包括决策树、判别分析、最近邻分类器、基于核方法的分类器以及集成分类器。每种算法的性能均以分类准确率进行评估。通过比较所有算法在每个矩阵上的准确率，我们记录了每个矩阵对应的最佳性能模型及其得分。不同 k 值下取得的最高准确率及其对应的分类算法如表4所示。表4：不同k值下的最佳准确率及对应算法

根据表4结果可知，当窗口参数k=1,500时，支持向量机（SVM）模型取得了最佳分类性能，其准确率达到99.7%。为进一步比较各算法在该参数下的表现，我们在 k = 1,500 所对应的矩阵上进行了多模型评估。表5列出了在该条件下不同分类算法所获得的准确率。表5：k=1,500时不同算法的准确率比较

在训练阶段，模型以每秒处理 39,000 个观测点的速度运行，总训练时长为 2.255 秒。所使用的模型为一对一中型高斯支持向量机，其核心参数包括：高斯核函数、核尺度 2.8，以及框约束级别 1。为获得更稳健的性能估计，本研究采用了交叉验证方法。该方法将完整数据集随机划分为Kcv个独立子集（本研究中Kcv=5），依次以其中一个子集作为验证集，其余作为训练集，从而得到更可靠的评估指标估计。如图3所示，数据集按比例划分为训练集（75%），验证集（15%）和测试集（10%），以分别用于模型训练、超参数调优及最终性能评估。

结果与讨论

基于分类器的机器学习技术，本研究采用了一种计算高效、流程简洁的方法，并取得了显著成果。通过滑动窗口进行数据预处理，并应用中规模高斯支持向量机算法，最终实现了 99.7% 的优异分类准确率。该模型能够有效预测离心泵的五种运行状态，分别为： 1. 无缺陷（类别1） 2. 叶轮破损（类别2） 3. 叶轮堵塞（类别3） 4. 轴承内圈缺陷（类别4） 5. 轴承外圈缺陷（类别5）为全面评估模型性能，图4展示了对应的混淆矩阵，图5则给出了受试者工作特征（ROC）曲线。这些可视化结果为进一步分析模型的分类能力与泛化有效性提供了直观依据。

图4：混淆矩阵

图5：ROC曲线图6直观展示了模型对五个类别的分类结果，而表6进一步报告了该模型在各具体类别（包括无缺陷、叶轮破损、叶轮堵塞、轴承内圈缺陷及轴承外圈缺陷）上的正向预测值（PPV）与错误发现率（FDR）。

图6：5个类别预测准确率表6：各分类的PPV与FDR

类别1（无缺陷）的预测性能相对略低，其预测误差为0.9%，且在所有类别中错误发现率最高。广告悄悄读个硕士吧 2年制研究生，在职可读~ 张老师教育查看本研究采用滑动窗口法进行数据预处理，并结合机器学习分类技术，取得了优异的预测效果，整体准确率达99.7%。该性能优于 Kumar 等人（2020）所报告的大部分已有预测模型，仅略低于其改进型卷积神经网络（CNN）模型约0.3%。然而，该CNN模型结构更为复杂、计算资源消耗大且训练时间显著更长。相比之下，本研究提出的方法在实现相近性能的同时，具备更高的效率与成本效益。

结论

本研究旨在开发一种基于机器学习的离心泵状态评估与故障类型预测模型。实验数据来源于测试台采集的声学与振动信号。通过滑动窗口法进行数据预处理，并选用支持向量机作为分类算法，最终模型取得了99.7%的预测准确率，体现了该方法在保持较高性能的同时具备较好的计算效率，相比深度学习方案更具成本优势。在后续工作中，可通过设计针对性的集成学习策略，进一步提升类别1的识别性能。此外，可结合实际维护场景开展成本效益分析，评估本预测系统的实际应用价值。未来也可尝试将回归模型应用于振动与声学数据，以实现离心泵剩余使用寿命的预测，从而为预防性维护提供更全面的决策支持。

参考文献

基于预测性维护模型的离心泵故障诊断

推荐