Todos hemos escuchado de los expertos en confiabilidad que la “curva de la bañera” (la pobre y malentendida curva de la bañera) no refleja con precisión la tasa de fallas de una máquina en función del tiempo. Si bien hay mucho de verdad en esta premisa, hay más en la historia, y comprender verdaderamente la relación entre la tasa de fallas y el tiempo puede ayudarlo a lograr mejoras revolucionarias en la confiabilidad.
Confiabilidad: curva de la bañera, libre de la trampa del azar
Los expertos en mantenimiento centrado en la confiabilidad utilizan correctamente esta información para modificar y optimizar los planes.
Antes de continuar, tenga presente que la conocida curva de la bañera es un modelo conceptual que generalmente define todas las regiones de tasa de falla probable que una máquina, un componente o un modo de falla individual podría exhibir en función del tiempo, los ciclos o las millas (en este artículo nos centraremos en el tiempo). Estas regiones incluyen la mortalidad infantil, la tasa de falla constante y el desgaste. Notablemente ausente de la curva de la bañera convencional está el escenario de tasa de falla que aumenta linealmente, que se observa comúnmente en los equipos, pero que puede reemplazar el área plana de la curva convencional.
Antes de continuar leyendo, abandone la idea de que se espera que la curva ilustre la vida útil confiable de sus máquinas o sistemas específicos a lo largo del tiempo.
Para evitar una avalancha de correos electrónicos desagradables, la afirmación de los expertos en confiabilidad de que la mayoría de las máquinas presentan una tasa constante de fallas en función del tiempo durante la mayor parte de su vida útil es generalmente correcta. El período de tasa de fallas constante a menudo sigue a un período de mortalidad infantil (la vida temprana de la máquina) durante el cual la tasa de fallas es elevada. Los expertos en mantenimiento centrado en la confiabilidad utilizan correctamente esta información para modificar y optimizar los planes de mantenimiento. Nuevamente, para los equipos mecánicos, la tasa de fallas a menudo aumenta linealmente en función del tiempo.
Sin embargo, quiero cambiar su visión del período de tasa de fallas constantes, la región en la que la mayoría de sus máquinas pasan la mayor parte de sus vidas una vez que sobreviven a la mortalidad infantil. A esto se le suele llamar el período de fallas “aleatorio”, lo que probablemente explica por qué es la región menos comprendida. Si bien la tasa de fallas puede ser matemáticamente aleatoria porque las máquinas no muestran una relación temporal definitiva, eso no quiere decir que las fallas no tengan causa. Aceptar que las fallas son matemáticamente aleatorias puede hacer que el individuo o la organización acepten la creencia de que la tasa de fallas no se puede controlar (un error común).
La respuesta típica y adecuada a una tasa de fallas constantes es desarrollar un programa de inspección y monitoreo adecuado y emplear un mantenimiento basado en la condición. El pilar predictivo del mantenimiento basado en condición (CMB, por sus siglas en inglés) sigue siendo reactivo; es una forma mucho más aceptable que esperar hasta que se vea afectada la función de la máquina, pero es reactivo de todos modos. Si aceptamos que la tasa de fallas es aleatoria y no logramos comprender por qué ocurren las fallas, perdemos oportunidades de alterar proactivamente la tasa de fallas a través de cambios en el diseño de la máquina, el contexto operativo y el control de las condiciones ambientales.
En realidad, el período de tasa de falla constante parece constante porque: a) algunos de los modos de falla son de hecho aleatorio en función del tiempo, y b) hay tantos modos de falla no relacionados que contribuyen a la tasa general, que el resultado parece ser aleatorio (Figura 1). Para modos de falla verdaderamente aleatorios, CBM es su mejor opción. Sin embargo, si el tiempo hasta la falla pudiera evaluarse individualmente modo por modo, probablemente descubriría que muchos de los modos de falla individuales de hecho muestran una relación temporal, que aumenta o disminuye en función del tiempo. Si se puede establecer una relación definitiva entre la tasa de falla y el tiempo para un modo de falla, específico, puede tomar medidas proactivas para cambiar la relación. Cuando todos los modos se agrupan para producir una tasa de falla constante, lo que crea una apariencia aleatoria, todo lo que puede hacer es esperar la próxima falla, esperar que el programa de monitoreo la detecte y luego reaccionar ante ella.
Si se puede establecer una dependencia temporal para un modo de falla dado que exhibe una tendencia central clara (promedio) y una pequeña cantidad de dispersión (desviación estándar), y el diseño de la máquina, el contexto operativo o el contexto ambiental no se pueden modificar, aún se tiene la opción de seleccionar una tarea de mantenimiento de “tiempo difícil”. Me doy cuenta de que estoy oponiéndome a la convención moderna, que está orientada hacia el CBM como mejor práctica. A pesar del poder del monitoreo de condición, las tareas de mantenimiento programadas de tiempo difícil siguen siendo las más fáciles de planificar y, por lo general, las menos costosas de ejecutar. Si un modo de falla para una máquina sugiere una dependencia temporal clara, y los objetivos de confiabilidad se pueden lograr de manera más efectiva y eficiente al abordarlo mediante acciones de tiempo difícil, entonces ese debería ser su curso de acción. Sin lugar a duda, para los modos de falla sin una dependencia temporal clara, el CBM es el curso preferido.
Además de brindar la opción de simplificar el mantenimiento con tareas de mantenimiento racionalizadas, para los modos de falla que tienen una dependencia temporal claramente definida, los ingenieros de confiabilidad cuentan con numerosas oportunidades para mejorar la confiabilidad de manera proactiva. A continuación, se presentan algunas:
1) Permitir cambios de diseño efectivos. Las fases de diseño, construcción y puesta en servicio del ciclo de vida de una máquina determinan su “código genético” o predisposición a la confiabilidad en relación con los contextos operativos y ambientales. Al recopilar datos de fallas por modo de falla individual, los ingenieros de confiabilidad pueden respaldar de manera más efectiva el proceso de diseño. Una cosa es decirles a los ingenieros de diseño que la máquina debería ser más confiable (un escenario típico), y otra muy distinta es proporcionarles datos de falla específicos desglosados por modo de falla. Armados con datos de campo de calidad, los ingenieros de diseño pueden realizar cambios específicos. Sin ellos, se ven obligados a adivinar.
2) Reducir los fallos en los primeros meses de vida útil. Las máquinas suelen sufrir fallos costosos en los primeros meses de vida útil tras la puesta en servicio o un mantenimiento importante. Al recopilar y analizar los datos de fallos por modo individual, los ingenieros de fiabilidad pueden tomar medidas específicas para aumentar el control sobre los factores que se sabe que provocan fallos en los primeros meses de vida útil, como aumentar la precisión durante la instalación, crear y ejecutar procedimientos de puesta en marcha que reduzcan el riesgo, etc.
3) Optimice los intervalos de monitoreo de condición. Suponga que un modo de falla exhibe una dependencia temporal, pero no es lo suficientemente fuerte como para justificar una actividad de mantenimiento urgente. Usted elige emplear tareas de monitoreo de condición que han demostrado ser efectivas. ¿No debería su conocimiento sobre la dependencia temporal del modo de falla influir en su intervalo de monitoreo? La mayoría de las rutas de monitoreo de condición se basan en tiempos estrictos (mensuales, trimestrales, etc.). Si bien la dependencia temporal de un modo de falla específico puede no ser lo suficientemente fuerte como para justificar una reparación urgente o el reemplazo del componente o las áreas afectadas, podría justificar la disminución del intervalo de monitoreo o inspección a medida que la máquina ingresa al período de alto riesgo.
Para analizar fallas por modos de falla específicos, debe volverse disciplinado en la recopilación de datos de campo, lo que requerirá trabajo y diligencia. Afortunadamente, no necesita reinventar la rueda. La norma IEC 300-3-2 (“Guía de aplicación: recopilación de datos de confiabilidad del campo”) proporciona una buena receta para crear un proceso de recopilación de datos de campo. Asimismo, la norma IEC 812 (“Procedimiento para el análisis de modos de falla y efectos [FMEA]”) proporciona un sistema de codificación de modos de falla genérico para que pueda categorizar de manera efectiva los datos de campo. Proporciona una buena base. Con cierta expansión, puede personalizarlo para que refleje con precisión sus máquinas y sistemas. Introduzca los datos de falla en el FMEA. Esto proporciona la estructura organizativa para impulsar el cambio.
Así pues, dejemos de insistir con la curva de la bañera y empecemos a ponerla a trabajar para nosotros. Si bien la curva de la bañera puede no definir la vida útil de confiabilidad de muchos sistemas de planta, proporciona un marco conceptual para comprender las fallas como una función del tiempo. Al desglosar las fallas modo por modo, le permite liberarse de la trampa aleatoria en la que simplemente acepta que lo aleatorio es incontrolable.
Referencia: Troyer, D. (2024, 07 septiembre).Curva de la bañera: libérese de la trampa del azar. https://www.reliableplant.com/Read/1634/break-free-of-rom-trap
Fuente: Congreso Latinoamericano de Mantenimiento y Confiabilidad