Siri
"Siri para la industria está en camino"
Ya no nos sorprende cuando vemos personas hablando con Alexa o Siri en un lenguaje sencillo.
Tener un asistente de la industria digital es solo cuestión de tiempo. Pero primero, ¡necesitamos un esfuerzo de equipo para construir un corpus!
¡Permítanme comenzar diciendo que escribí este artículo completamente yo mismo! ¿En serio?
Bueno, engañarnos con artículos generados por IA (Intelogencia artificial) es una de las muchas formas en que GPT-3 (Generative Pre-trained Transformer 3) ha llamado nuestra atención durante los últimos meses.
Un estudiante universitario usó GPT-3 para generar una publicación de blog sobre qué hacer cuando se siente improductivo, terminó en la cima de Hacker News con más de 26,000 visitas.
Solo una persona preguntó si estaba escrito por AI. Anteriormente, otra publicación de blog sobre por qué GPT-3 puede ser lo más importante desde que bitcoin se volvió viral, principalmente porque el autor sorprendió a sus lectores en el último párrafo al revelar que todo el texto fue generado por GPT-3.
Hace unos meses, The Guardian generó algo de publicidad con un experimento similar.
Hay muchos otros ejemplos interesantes que hacen de GPT-3 un verdadero revuelo en la comunidad de IA e incluso más allá.
Pero, ¿por qué es tan importante para el procesamiento del lenguaje natural (PNL)?
PNL hasta ahora ...
La PNL puede considerarse una rama de la IA y se trata de dar sentido al lenguaje humano. La PNL se origina en la década de 1950, pero la última década trajo una verdadera revolución.
Pasamos de vectorizar palabras y analizar similitudes de palabras (p. Ej., "El hombre es para niño" y "la mujer es para niña") con word2vec en 2013 al modelo Transformer propuesto en el documento "La atención es todo lo que necesitas" publicado en 2017.
Transformers apalancamiento el uso de mecanismos de atención para recopilar información sobre el contexto de una palabra dada y codificar esa información en el vector que representa la palabra (por ejemplo, tengo una "fecha" esta noche vs ¿Qué "fecha" es hoy?). Los transformadores son la base de modelos de lenguaje de última generación como BERT y GPT.
"Atención por favor"
Los modelos de lenguaje son los nuevos chicos del bloque en PNL. Básicamente, predicen la probabilidad de que aparezca una palabra en un texto, dadas todas las demás palabras de ese texto (por ejemplo, "Hoy es [MÁSCARA]. Vamos a la playa"). Conocer la probabilidad condicional de las palabras es la base para una variedad de tareas posteriores de la PNL, como la creación de contenido, la traducción de idiomas, la autocompletación, la respuesta a preguntas y la clasificación de texto.
La mayoría de los modelos de lenguaje se entrenan previamente en un conjunto de datos grande (como Wikipedia) y luego se ajustan para realizar una tarea específica de PNL en un conjunto de datos más pequeño. Este proceso se llama aprendizaje por transferencia.
¿Qué es GPT-3?
GPT-3 es la tercera versión de los modelos de transformadores preentrenados generativos desarrollados por OpenAI, el especialista en inteligencia artificial cofundado por Elon Musk, aunque ya no está a bordo. Sin embargo, no hay grandes avances en términos de arquitectura, se considera el modelo de lenguaje más poderoso de todos los tiempos. ¿Por qué? ¡Por su tamaño!
El modelo tiene unos impresionantes 175 mil millones de parámetros y fue entrenado previamente en un corpus de casi medio billón de palabras, principalmente de Internet. De hecho, el modelo es tan grande que no se requiere ningún ajuste fino. Sabe tanto sobre el lenguaje que puede aprender tareas de PNL que nunca antes había encontrado con solo darle algunos ejemplos. A esto se le llama aprendizaje de pocas oportunidades. La idea de un modelo tan general es muy tentadora porque abre el camino para democratizar la IA y hacer que la PNL sea accesible para todos.
Seamos prácticos
La idea es tentadora. Desafortunadamente, solo personas limitadas tienen acceso a la API beta para GPT-3 por ahora, pero suscribirse a la versión premium de AI Dungeon le brinda una solución alternativa que le permite echar un vistazo a lo que el modelo realmente puede hacer.
Echemos un vistazo y veamos cómo podría ayudar a los profesionales de mantenimiento y gerentes de operaciones a respaldar su trabajo diario.
Le di al modelo un pequeño contexto para calentar y le hice una pregunta sobre los modos de falla de la bomba. El texto en negrita es completamente generado por el sistema de IA.
Las bombas centrífugas son uno de los tipos de bombas más utilizados en el mundo y tienen una amplia gama de aplicaciones, desde el procesamiento de alimentos hasta el transporte de agua o aguas residuales.
Los problemas que surgen dentro de estas máquinas disminuyen el flujo del fluido dentro de las tuberías, interrumpiendo así la producción y el transporte del fluido a su destino dentro del proceso.
¿Cuáles son los modos de falla más comunes que se encuentran en las bombas centrífugas en la industria de aguas residuales?
A: La principal causa de fallas es la falta de lubricación. Si no hay aceite o grasa en los engranajes, entonces no se moverá con suavidad y la máquina puede dejar de funcionar por completo.
B: La presión del agua dentro de las tuberías puede ser demasiado baja. Cuando esto sucede, la bomba comenzará a tener fugas y eventualmente explotará.
C: Puede haber un problema con los cojinetes de la caja de cambios. Si están desgastados, deberán reemplazarse junto con el aceite y la grasa que contienen.
D: Un filtro obstruido o sucio puede estar restringiendo el flujo del líquido. Si el filtro se obstruye, es necesario limpiarlo o reemplazarlo.
E: Si el operador no tiene los métodos de mantenimiento correctos, entonces la máquina puede comenzar a sobrecalentarse y averiarse. Esto implica detener el mecanismo de la bomba y limpiarlo a fondo.
F: A veces, la bomba falla debido a un defecto de fabricación. Esto es extremadamente raro y solo ocurre debido a un control de calidad deficiente durante la fabricación. Si la bomba funciona correctamente, pero es vieja y muestra signos de desgaste, debe reemplazarse.
G: El mayor riesgo de falla se debe al error del operador. Las bombas son máquinas de trabajo muy pesado que pueden pasar miles de horas de funcionamiento y aún así tardar mucho en averiarse. El operador debe tener cuidado al trabajar en y alrededor de la bomba, manteniendo su pie firme en el suelo en todo momento.
Debe admitir que el modelo puede pasar de alguna manera la prueba de Turing y engañarlo lo suficiente al fingir que sabe una cosa o dos sobre bombas. Puede hablar como alguien que ha estado en la industria durante años, pero ¿es esto suficiente para convertirse en su compañero digital? Otra ronda. Enfrenté al modelo con un caso un poco más específico. Nuevamente, el texto en negrita lo genera la IA.
Un operador de mina guineano está utilizando un minero de superficie Wirtgen 2200 SM con un motor diesel C27 ATAAC V12 que produce 950 HP a 2100 RPM y un tambor de corte de 2,2 m de largo para extraer bauxita *. El minero de superficie quedó fuera de servicio y el turbocompresor entró en el taller de reparaciones con una válvula de escape rota. Todo estaba rojo. ¿Cuál podría ser la razón de este fracaso?
* Para las mentes curiosas: la bauxita es el principal mineral utilizado para la producción de aluminio.
La Wirtgen 2200 SM es una máquina muy fiable, pero tiene sus limitaciones. Su principal debilidad es que solo puede operar en una dirección: hacia arriba o hacia abajo.
Esta vez te hace reír. Tuve otras conversaciones en las que el modelo inicialmente dio una respuesta significativa, pero terminó contando la historia de dos hombres que salían de un vehículo, vestían un mono con el rostro cubierto por máscaras contra el polvo y apuntaban con sus armas a un operador que desmantelaba una bomba.
Lo curioso es que GPT-3 nunca te dirá "No lo sé". Esto me recuerda a esos tipos en el bar que siempre tienen algo que decir y actúan como si fueran expertos en todos los temas. Al principio estás impresionado, pero ¿son tan inteligentes?
"Es humano si no sabes algo"
Terminé con la misma sensación después de un par de rondas de AI Dungeon. Primero te quedas impresionado, pero luego te das cuenta de que el modelo no arreglará la bomba o el turbocompresor.
Cada persona al azar con algo de cerebro y un motor de búsqueda eventualmente puede formular una respuesta a la primera pregunta sin entender cómo funciona una bomba. Para el segundo ejemplo, está claro que debe alejarse de los modos de falla de diseño y tener una buena comprensión de las condiciones de operación antes de poder hacer un diagnóstico de fallas completo.
De hecho, no se puede culpar a GPT-3 por estar equivocado, porque fue entrenado con el conocimiento de los libros y no con ningún lenguaje que tenga significado en una instalación minera o un piso de producción. Leer Internet simplemente no es suficiente para comprender cómo se comportan los activos físicos en el mundo real.
¿Qué le aporta a la industria?
"Leer Internet no es suficiente. Deberíamos empezar a leer la fábrica"
Los modelos generales son una gran idea pero si realmente queremos democratizar el uso de modelos de lenguaje para las empresas industriales, deberían empezar a leer la fábrica. Por lo tanto, deberíamos crear un Rastreo común para la industria: un gran corpus con jerga específica de dominio, abreviaturas, errores ortográficos, sinónimos y asociaciones de palabras que normalmente podemos encontrar en registros de mantenimiento, registros de operadores y de calidad, reclamos de garantía, hojas de datos de activos, manuales de productos, etc. Las bases de datos a nivel de empresa que contienen miles o millones de registros no son lo suficientemente grandes para aprender la verdadera semántica del lenguaje industrial. El esfuerzo para construir un corpus debe ser de toda la industria.
Un gran ejemplo de tal esfuerzo se puede encontrar en la atención médica, donde se utilizan bibliotecas con léxico médico en combinación con PNL para extraer información clínica relevante de datos no estructurados que se encuentran en registros médicos electrónicos.
Es un pequeño paso aplicar una metodología similar a los registros de mantenimiento, donde la información más valiosa a menudo se almacena en campos de texto libre, como los síntomas y las causas raíz asociadas con eventos de falla u otros problemas, y las acciones físicas tomadas para reparar componentes. , máquinas o subsistemas.
Estos datos se recopilan para cada máquina durante toda su vida útil.
Estructurar este conocimiento humano en características significativas y vincularlo con datos de proceso de transmisión abre una nueva puerta para crear aplicaciones de mantenimiento prescriptivo donde las recomendaciones se basan en lo que funciona bien dentro del contexto particular de una fábrica, y no en lo que funciona bien en general (como nosotros encontrar en bibliotecas de modo de falla de diseño).
El camino por delante
Si podemos aprovechar el potencial oculto de toda esta información no estructurada y comprenderla realmente, entonces podemos vincular los oídos y los ojos del piso de producción con los hechos concretos y las mediciones derivadas de los datos históricos y de los sensores de transmisión.
La combinación de la PNL con el aprendizaje automático (ML) permite crear aplicaciones reales de Human-In-The-Loop en las que se obtienen conocimientos prácticos del lenguaje humano para ayudar a los operadores, técnicos e ingenieros en sus trabajos cotidianos.
Además, el conocimiento que tienen se puede utilizar para dar retroalimentación, en sus propias palabras, sobre esas recetas, mejorando el sistema de AA para los próximos desafíos que surjan.
https://www.maintworld.com/R-D/Siri-for-industry-is-on-its-way