RESUMEN: El uso de las redes neuronales artificiales de base radial para la estimación de las propiedades mecánicas de las hornadas a partir de su composición química y superficie transversal del perfil terminado,facilita el proceso de generación de opciones de destino de hornadas de perfiles ligeros de acero destinados a la construcción. En el trabajo realizadoesta estimación se hizopor redes de base radial entrenadas con el método iterativo de regularización de Landweber, a partir de los datos acumulados de ensayos mecánicos en los talleresadoptados como Estudio de Caso, los que producen fundamentalmente barras corrugadas de acero para su uso en la construcción. La utilización de redes regularizadas permite disminuir los errores de generalización en la estimación de las propiedades mecánicas, mejorando así la calidad de las opciones de destino de las hornadas producidas.
Palabras claves: redes neuronales artificiales de base radialredes neuronales artificiales de base radial,estrategias de regularizaciónestrategias de regularización,dirección operativa de la produccióndirección operativa de la producción.
ABSTRACT: The use of the radial baseartificial neural networks for the estimation of the mechanical properties of the heats starting from its chemical composition and traverse surface of the finished profile facilitates the options generation process forthe heats destination while producingsteel slight profiles dedicated to the constructions. In the present work this estimation is made by radial base artificial neural networks, trained by the Landweber regularization iterative method, starting from the available mechanical properties data obtained from the quality control of the workshops adopted as Study Case. The use of regularized networks allows diminishing the generalized errors in the mechanical properties estimation, improving this way the quality of the options of destination of the heats produced.
Key words: basis neural networks, regularization strategies,operative production management.
Artículo Original
Redes neuronales regularizadas aplicadas a la estimación de propiedades mecánicas de perfiles de acero
Regularized neural networks applied to the estimation of the mechanical properties of steel profiles
Recepción: 11 Enero 2017
Aprobación: 30 Junio 2017
En las empresas siderúrgicas, el aseguramiento de las propiedades normadas de la producción terminada y entregada a los clientes comprende no solo la asignación adecuada de semiproductos para la fabricación de productos terminados, sino también la conducción racional de los procesos productivos [1,2].
La planificación de las entregas de la producción terminada se realiza por pedidos, lo que presupone la producción de acuerdo a la llegada misma de cada pedido, o por inventarios, lo que implica producir para acumular inventarios y entregar de acuerdo a la disponibilidad del pedido. Una combinación de ambos es la opción indicada para minimizar costos totales [3-5].
En [6] se propone un esquema para el procesamiento de los pedidos de los clientes para su conversión en órdenes de producción, combinando planificación de las entregaspor pedidos y por inventarios. A partir de estas órdenes de producción se elaboran las secuencias de los talleres de laminación. En caso particular de los perfiles para la construcción, cada orden necesariamente incluye el diámetro del perfil, la longitud de las barras y norma de calidad a satisfacer. Las mejores opciones de destino de hornadas de materiales son aquellas en las que se minimiza el exceso de propiedades mecánicas, asegurando los valores requeridos de éstas para el cumplimiento de la designación de servicio [7]. El problema de cuales hornadas han de ser utilizadas en determinados destinos del conjunto de hornadas en proceso, constituye un problema de selección óptima de materiales [8]. Los modelos matemáticos usados para la generación o selecciónde opciones hace necesaria la estimación de las propiedades mecánicas de las hornadas a partir de su composición química y sección transversal del producto fabricado con la máxima precisión posible, para las condiciones de un taller de laminación de perfiles terminados dado, el que se caracteriza de regímenes de deformación y de calentamiento dados. La estimación precisa de las propiedades mecánicas de los aceros para la construcción constituye una tarea muy actual, dada la necesidad de definir su destino, es decir, taller, perfil y grado que resulta más racional para la empresa productora, asegurando los indicadores de calidad requeridos por los clientes [8].
Este trabajo se realizó a partir de los datos de dos talleres de laminación de una empresa siderúrgica, los que producen fundamentalmente barras corrugadas de acero para la construcción, a partir de palanquillas de sección cuadrada coladas en una instalación de vaciado continuo. Las propiedades principales de dichas barras son el límite de fluencia y el límite de rotura. En investigaciones anteriores se trató de estimar estas propiedades para los diferentes talleres de laminación por modelos de regresión lineales y cuadráticos [8]. El uso de estos modelos tiene el inconveniente de que producen excesivos errores estándar en los resultados calculados, con respecto a las mediciones, de alrededor del orden del 8 % - 10 % de su valor medio, lo que resulta excesivo para la adecuada determinación de un destino razonable. Por la razón anterior en este trabajo se aplican las redes neuronales de base radial entrenadas con el método de regularización de Landweber, conocidas como redes neuronales de base radial regularizadas, para estimar las propiedades mecánicas de los perfiles ligeros de acero.Con el uso de estas redes se logra disminuir el error de generalización producido en el ajuste, con respecto a los modelos obtenidos en trabajos anteriores, lo que hace posible la elección de un mejor destino para las hornadas de acero.
La ecuación de salida para la red neuronal con d neuronas de base radial y f neuronas de salida es la siguiente ecuación 1:
(1)El aprendizaje de las redes neuronales artificiales de base radial generalmente es de tipo híbrido, realizándose en dos etapas [9]. Primeramente, se lleva a cabo un entrenamiento no supervisado en la capa oculta, o sea, se determina la respuesta de las funciones de base radial ante el conjunto de datos de entrada (φ(r) en la ecuación 1. Posteriormente se realiza un entrenamiento supervisado en la capa de salida: Con la respuesta de las neuronas de la capa oculta se determinan los pesos y bias de la capa de salida, de manera que la salida sea la deseada en los datos de entrenamiento [10-12].
Sea K: ℝd+1 → ℝh un operador lineal determinado por la matriz que representa la respuesta de las funciones de base radial ante un conjunto de vectores de entrada; el proceso de búsqueda de los pesos y bias de la capa de salida se puede formular de la siguiente manera: Hallar la matriz real w, de orden (d+1)×f, como la solución de la ecuación lineal. Ver ecuación 2
(2)Esta ecuación puede resolverse por el método de mínimos cuadrados. De esta forma las redes neuronales de base radial dejan un error de casi cero en los datos de entrenamiento, pero muchas veces un error grande en la validación o generalización [12].
Un análisis de la ecuación 2 permite concluir que la búsqueda de los pesos y bias de la capa de salida, o sea, la fase supervisada del entrenamiento de la red neuronal de base radial, puede interpretarse como la solución de un problema inverso, lo que permite que se puedan aplicar técnicas de regularización para su solución [13-15].
El método de Landweber es una estrategia de regularización de problemas inversos. Se utiliza para dar una solución aproximada de la ecuación 2, cuando las mediciones del miembro de la derecha están contaminadas con ruido [16-17].
La solución aproximada de la ecuación 2, wδ,donde el supraíndice δ indica que la solución es obtenida con los datos ruidosos, se computa por el proceso iterativo, ecuación 3.
(3)para algún α tal que
denota el operador conjugado del operador K.
Ahora, sea K: X→ Yun operador lineal, compacto e inyectivo con subespacio imagen denso; sea u ∈ ℝ, u > 1 y Rδ ∈ Y de manera que ‖R-Rδ‖ < δ y ‖Rδ‖ ≥ uδ; las siguientes afirmaciones son válidas:
,∀δ >0; o sea, se puede realizar el proceso iterativo 3 hasta encontrar el más pequeño entero t = t(δ) con el cual se garantiza que ‖Kwt,δ -Rδ‖ ≤ uδ. Esta constituye la regla de parada de dicho algoritmo.
, si w = K’f se encuentra en el subespacio imagen del operador K, para algún e > 0 y para algún f con ‖f‖ ≤ E. Esta constituye una aproximación del error máximo cometido al computar la solución por el proceso iterativo de la ecuación 3.
Los modelos matemáticos usados para la generación de opciones hacen necesaria la estimación de las propiedades mecánicas de las hornadas a partir de su composición química y sección transversal del producto fabricado con la máxima precisión posible, para las condiciones de un taller de laminación de perfiles terminados dado, el que se caracteriza de regímenes de deformación y de calentamiento dados. El problema general de la generación de opciones de destino de semiproductos del acero se puede modelar de la siguiente manera: se requiere definir un compromiso entre la minimización del exceso de las propiedades normadas Re y Rm (límite de fluencia y límite de rotura, respectivamente) de las m hornadas entregadas, y el riesgo asumido (probabilidad de rechazo de la hornada una vez laminada, por el sistema de aceptación - rechazo).Formalmente, ecuación 4:
(4)Sujeto a:
(5)
(6)
(7)La función objetivo (ecuación 4) persigue la selección de la opción con mínimo exceso de la propiedad Re o Rm, asegurada con una probabilidad mayor o igual ah. Las restricciones en la ecuación 5 y en la ecuación 6 obligan al cumplimiento del destino asignado con una probabilidad mayor o igual a h, para las dos propiedades y todos los destinos, de todas las hornadas que se van a asignar. La restricción en La ecuación 7, precisa que para cada hornada puede establecerse solo un destino.
Queda establecida entonces por el modelo la necesidad de estimar las propiedades mecánicas de las hornadas, a partir de su composición química y sección transversal del producto terminado.
En investigaciones anteriores [8] se trató de estimar las propiedades para los diferentes talleres de laminación de productos terminados de la empresa por modelos de regresión lineales y cuadráticos, pero el error absoluto es del orden 1,7 a 3,0 kgf/mm2; se hace indispensable entonces la utilización de otros métodos de estimación de las propiedades que conduzcan a la reducción del error de apreciación del modelo.
Del laboratorio de ensayos mecánicos de la empresa siderúrgica se seleccionaron al azar 5000 datos para la etapa de entrenamiento de la red y 2000 datos para la etapa de validación o generalización en el Taller 1; en el Taller 2 se seleccionaron 4000 datos para el entrenamiento y 2000 para la validación.
En la primera etapa de entrenamiento de cada red neuronal se tomaron 100 neuronas de la capa oculta, todas con funciones gaussianas, y luego se procedió al cálculo de los centros y de los anchos. Los centros se determinaron por el algoritmo de las k-medias, y los anchos como la media uniforme de las distancias del centro de cada neurona a los 10 centros más cercanos. Luego se aumentó la cantidad de neuronas de la capa oculta, añadiendo 10 neuronas en cada experimento, hasta que se obtuvo el mejor ajuste de los datos entre todas las pruebas realizadas. En la etapa de validación no se tuvieron resultados muy significativos, aunque sí se obtuvo un ajuste ligeramente superior con respecto a las ecuaciones de regresión descritas en [8], usando el mismo conjunto de datos. Entonces se decidió realizar la fase supervisada del entrenamiento de las redes con el método de regularización iterativo de Landweber, con un valor definitivo de α = 0,032, a partir del conocimiento de que las mediciones tenían un ruido de ± 0,35 kgf/mm2.
Con el procedimiento descrito anteriormente se obtuvieron dos redes neuronales de base radial, una para cada taller, que estiman las propiedades límite de fluencia y límite de rotura de los perfiles ligeros de acero producidos en cada uno, a partir de las concentraciones de Si, P, S, Cr, Ni y Cu, y al perfil de las barras. En la figura 1 se muestran los errores de validación en el ajuste de las propiedades mecánicas usando la red neuronal, en el Taller 1.

Como se puede apreciar los errores en la etapa de generalización no son elevados, y están dentro de un intervalo aceptable para la estimación de dichas propiedades mecánicas de las hornadas. En la figura 2 se muestran los errores obtenidos al estimar las propiedades de las hornadas en el Taller 2.

Es válido destacar que los errores de generalización en la estimación de las propiedades en el Taller 2 no son muy groseros y también se consideran dentro de un intervalo aceptable. Esto es un resultado satisfactorio, pues constituye una prueba de que las redes neuronales entrenadas con regularización son útiles para estimar las propiedades mecánicas de las hornadas producidas en cada taller.
En la tabla 1 se muestra la comparación entre algunos indicadores de la estimación realizada en el Taller1con ambas redes neuronales: la red neuronal sin regularizar y regularizada. Se evidencia la considerable reducción de las neuronas de base radial en la capa oculta de la red de base radial regularizada, lo que favorece el proceso de cómputo de las propiedades.

No cabe dudas de que el ajuste realizado con las redes de base radial regularizadas es mejor con respecto al realizado usando las redes no regularizadas. Un análisis del coeficiente de determinación R2 para la red regularizada permite concluir que en cada propiedad estimada, más del 90 % de las variaciones en los datos es explicada por el modelo obtenido; asimismo los errores cuadráticos medios son pequeños.
En la tabla 2 se muestran los mismos indicadores del ajuste, pero en el Taller2. Nuevamente se evidencia una reducción de la cantidad de neuronas de base radial en las redes regularizadas, con respecto a las no regularizadas.

El ajuste realizado en el Taller 2 con las redes de base radial regularizadas, es superior al realizado con las redes no regularizadas. El coeficiente de determinación evidencia una elevada explicación de los datos por el modelo y una fuerte correlación lineal entre los datos experimentales y los estimados por la red; además, el error cuadrático medio es pequeño.
Las cifras reflejadas en las tablas 1 y 2 confirman la alta bondad del ajuste realizado con las redes de base radial regularizadas y su utilidad en la estimación de las propiedades límite de fluencia y límite de rotura en cada taller.
En [8] se estimaron las propiedades mecánicas de las hornadas producidas en el Taller 1 usando ecuaciones de regresión de tipo lineales y cuadráticas. En la tabla 3 se muestran los parámetros de la regresión hecha con dichos modelos y con las redes de base radial regularizadas.

En el Taller 2 también se estimaron las propiedades por modelos lineales y cuadráticos. La comparación realizada por ambos métodos se muestra en la tabla 4.

Un examen de los datos contenidos en las tablas 3 y 4 ilustra la superioridad de las redes neuronales de base radial entrenadas con regularización con respecto a los modelos estudiados de regresión, en la estimación de las propiedades mecánicas de los perfiles ligeros de aceros. El uso de las redes regularizadas garantiza un valor calculado de las propiedades mecánicas con una alta probabilidad, lo cual es un requisito indispensable para la solución del modelo planteado en las ecuaciones 4, 5 y 6. Con este resultado se puede definir el destino de las hornadas de metal que resulta más racional para la empresa siderúrgica, asegurando los indicadores de calidad solicitados en los pedidos de los clientes. Esto trae consigo una mejor administración de los recursos y de la materia prima de la empresa.
La utilización de redes neuronales de base radial entrenadas con el algoritmo de Landweber permite reducir considerablemente el error cuadrático medio y aumentar el coeficiente de determinación en la estimación de las propiedades mecánicas, en ambos talleres de laminación de la empresa siderúrgica, con respecto a los modelos estadísticos lineales y cuadráticos obtenidos en trabajos anteriores. Este resultado permite mejorar la calidad de las opciones de destino generadas para cada hornada, garantizando una mejor distribución de los recursos de la empresa. De esta forma se justifica plenamente la utilización de la técnica propuesta en el presente trabajo para la estimación de las propiedades, en sustitución de las ecuaciones de regresión.





