Por: Gino Marín

Publicado el: 11 de junio de 2026

Colaboración Académica para la Universidad CENFOTEC.

En la entrega anterior, observamos como las IAs PINN logran resolver modelos físicos con un margen de error diminuto. Hoy, abordaremos una técnica de IA que puede ayudarnos a encontrar problemas mecánicos sin tener que verlos.

Hay algo entrañable en la imagen del mecánico veterano que se inclina sobre el motor, escucha unos segundos y dice «es la distribución». Esa pericia es real, vale oro y se construye con décadas de oficio. La pregunta interesante, y la que abre este recorrido, es si una red neuronal puede aprender a escuchar como ese mecánico.

La respuesta corta es que sí, y la respuesta larga es que ya lo está haciendo, con consecuencias prácticas para flotas, talleres y conductores. Te lo cuento sin perder de vista lo que la tecnología puede y no puede hacer hoy, porque la diferencia importa.

El problema

Los mecánicos confían en años de experiencia para diagnosticar problemas de motor de oído: un golpeteo sutil, un ralentí irregular, un zumbido en la caja de cambios. Es un arte. Pero la audición humana tiene límites, y los mecánicos se jubilan.

La solución de IA

Hay grupos de investigación que han construido modelos de clasificación de sonido con Keras y TensorFlow que analizan espectrogramas de audio (representaciones visuales de las frecuencias del sonido a lo largo del tiempo) para detectar fallos del motor con más del 92 % de precisión. Un sistema usa Coeficientes Cepstrales en Frecuencia Mel (MFCC) —características que capturan la «textura» del sonido— combinados con clasificadores ELM (Extreme Learning Machine) para identificar problemas como fallos de encendido, fallos de rodamientos y problemas de distribución.

Cómo funciona

1. Grabar el sonido del motor con un smartphone o un sensor.

2. Convertir el audio en un espectrograma (mapa de calor de frecuencia frente al tiempo).

3. Alimentar el espectrograma a una red neuronal convolucional (CNN) entrenada con miles de grabaciones de motores sanos y defectuosos.

4. 4. El modelo devuelve: «sano», «fallo de encendido detectado», «desgaste de rodamiento», etc.

Link del espectograma: https://musiclab.chromeexperiments.com/spectrogram/

Despliegue en el mundo real

Un estudio de 2024 alcanzó una precisión del 97 % en la detección de fallos usando clasificadores Random Forest con características de tiempo-frecuencia. Otro sistema, con preentrenamiento débilmente etiquetado sobre una arquitectura CRNN (red neuronal convolucional recurrente) multimodal, puede señalar eventos de fallo concretos en tiempo real.

Por qué importa

Esto democratiza el diagnóstico de nivel experto. Un mecánico novato con una app en el móvil puede captar problemas que dejarían perplejos a técnicos con experiencia. También se está usando en mantenimiento predictivo para flotas, detectando la degradación del motor antes de que se produzca la avería.

Por qué a un LLM le costaría esta tarea

Aquí merece la pena imaginar qué pasaría si pusiéramos un LLM a hacer este trabajo. El sonido de un motor es una forma de onda continua, miles de muestras por segundo, con relaciones de fase y armónicos sutilísimos que el oído entrenado capta sin necesidad de nombrarlos. Un LLM, por su naturaleza, opera sobre tokens discretos extraídos de texto. Puedes describirle un ruido —»un golpeteo metálico irregular»— y especulará razonablemente; pero no puede escuchar el motor. Para hacerlo necesitaría convertir el audio en tokens, y en esa conversión se pierden exactamente los matices que distinguen un fallo de encendido de un desgaste de rodamiento. Las CNN entrenadas sobre espectrogramas, en cambio, viven en ese espacio espectral desde el primer día y aprenden a leerlo con resolución de microsegundos. La inteligencia aquí no está en describir, sino en medir.

Lo que más llama la atención no es la precisión, sino lo que el modelo está haciendo en silencio: relacionar una textura sonora con un problema mecánico que ningún ingeniero le explicó en lenguaje natural. No «sabe» qué es un rodamiento; sabe que ciertos patrones espectrales preceden a ciertos modos de fallo. Es la misma clase de habilidad que un mecánico desarrolla con los años, comprimida en un entrenamiento sobre miles de motores. El oficio no desaparece; cambia de forma. La intuición humana, ahora amplificada por sensores y redes, sigue siendo la última instancia que decide qué hacer con el diagnóstico, y eso me parece una repartición sensata del trabajo entre persona y máquina.

Referencias

Engine Fault Detection by Sound Analysis (MDPI 2024)

Intelligent Sound-Based Early Fault Detection (CSSE 2023)

GitHub: car-sound-classification-with-keras