Artículos Originales

Algoritmos de Aprendizaje Supervisado para Proyección de Ventas de Camarón Ecuatoriano con Lenguaje de Programación Python

Supervised Learning Algorithms for Sales Projection of Ecuadorian Shrimp with Python Programming Language

Bernardo Patricio CORDERO-TORRES
Universidad Nacional Mayor de San Marcos, Perú

Algoritmos de Aprendizaje Supervisado para Proyección de Ventas de Camarón Ecuatoriano con Lenguaje de Programación Python

Economía y Negocios, vol. 13, no. 2, pp. 30-51, 2022

Universidad UTE

La Revista Economía y Negocios garantiza y declara que los autores conservan siempre todos los derechos de autor y de publicación de sus obras originales sin restricciones [© Los Autores]. El reconocimiento (BY) permite cualquier explotación de la obra, incluyendo una finalidad comercial, así como la creación de obras derivadas, la distribución de las cuales también está permitida sin ninguna restricción.

Received: 01 December 2021

Accepted: 16 May 2022

Published: 01 December 2022

Resumen: Esta investigación desarrolla la mejor aproximación para la proyección no lineal de las ventas de una empresa camaronera que cotiza en la bolsa de valores, en contraste con las estimaciones lineales corporativas publicadas. Se parte de la búsqueda de datos a través de un FODA de la variable de interés: precio promedio del camarón ecuatoriano, identificando las variables explicativas de precios del camarón en Estados Unidos, el cambio observado del dólar frente al yuan, exportaciones ecuatorianas, importaciones estadounidenses de camarón indio, barril de crudo WTI y el índice de precios FPI™ del salmón, esto como las variables más influyentes interpretadas por el resultado de un coeficiente de determinación ajustado de 0.807. La instrumentación del modelo econométrico evalúa los indicadores estadísticos de tres algoritmos de regresión lineal de aprendizaje supervisado predictivo en el lenguaje de programación Python, siendo Ridge el modelo con menor error cuadrático medio igual a 0.274. Basándose en supuestos a cinco años con Ridge se pronostican ventas desde 2021 a 2025, correlacionando las variables ingresos históricos de la empresa camaronera versus el precio promedio del camarón mediante interpolación polinomial. Comparando ambas líneas de tendencia resultantes se demuestra que los ingresos esperados conservan un comportamiento no lineal acorde con su desempeño histórico.

Palabras clave: Econometría, Aprendizaje supervisado, Lenguaje de programación python, Proyección de ventas, Industria camaronera.

Abstract: This research develops the best approximation for the non-linear projection of sales of a shrimp company listed on the Stock Exchange, in contrast to published corporate linear estimates. It starts from the search for data through a SWOT of the variable of interest: average price of Ecuadorian shrimp, identifying the variables: explanatory of shrimp prices in the United States, the observed change of the dollar against the yuan, Ecuadorian exports, US imports of Indian shrimp, barrel of WTI crude oil and the FPI™ salmon price index, as the most influential interpreted by the result of an adjusted coefficient of determination of 0.807. The instrumentation of the econometric model evaluates the statistical indicators of three predictive supervised learning linear regression algorithms in the Python programming language, with Ridge being the model with the lowest mean square error equal to 0.274. Based on five-year assumptions with Ridge, sales are forecast from 2021 to 2025, correlating the variables historical revenue of the shrimp company versus the average price of shrimp through polynomial interpolation, comparing both resulting trend lines showing that the expected revenues maintain a behavior non-linear according to its historical performance.

Keywords: Econometrics, Supervised learning, Python programming language, Sales Projection, Shrimp industry.

Introducción

La producción de camarón en Ecuador es un referente mundial (Lucien-Brun, 2018), así como relevante es su contribución a la economía del país, lo que torna imperante el poder aprovechar todos los datos disponibles y combinarlos con las herramientas estadísticas que ofrecen las ciencias de la computación, lo que permitiría aportar con nuevos hallazgos para establecer los posibles escenarios para la toma de decisiones estratégicas para hacer frente a una mayor incertidumbre inherente al Covid-19 (Gordillo et al., 2022). El objetivo de la investigación reside en modelar, con base a algoritmos de machine learning, los pronósticos de ventas de una exportadora de camarones ecuatoriana y contrastarlos con las proyecciones publicadas sobre su futuro financiero.

Bajo la premisa de que las empresas buscan financiar capital de trabajo o sus operaciones en el corto plazo, el modelado inicia con un modelo econométrico, Los inputs de este modelo económico consisten en variables que correlacionan directamente los precios promedios del camarón ecuatoriano de exportación (PPCE) y que arrojan predicciones validadas por su menor error cuadrático (Mojjada et al., 2020). Estos valores resultantes serán asociados con las ventas de la empresa, siendo ajustados a una función no lineal como ilustra la propia tendencia histórica de ingresos declarados en sus estados de resultados en la bolsa de valores, con lo cual finalizará el modelado. Estos resultados difieren de la expectativa obtenida por la calificadora de riesgos dentro del mismo periodo de tiempo para futuros periodos (Tenorio-Vilaña & Mideros-Mora, 2022).

Si bien este caso de estudio toma información presentada para financiamiento mediante la emisión de obligaciones por parte de una compañía calificadora de riesgos, este trabajo constituye una contribución para la búsqueda de aplicaciones prácticas de la investigación de operaciones que sustenten (bajo premisas comprobables) el control de la estructura patrimonial y la sostenibilidad del capital de trabajo de las empresas (Altaf & Shah, 2021). Esto se realiza con el fin de demostrar la capacidad de pago de una empresa frente a grupos de interés correspondientes a fuentes de posible apalancamiento en el corto plazo como son los accionistas, fondos propios y las obligaciones contraídas con entidades del sistema financiero, este último característico del tejido empresarial ecuatoriano (Gutiérrez Ponce et al., 2019). Como alternativa válida se considera, además, el crédito concedido por los proveedores (García Regalado et al., 2020).

Revisión de la Literatura

Desde el primer programa de inteligencia artificial empleado para el juego de damas trabajado por Arthur Samuel en 1959 (Gabel, 2019), la versatilidad presentada por los algoritmos de machine learning tienen un amplio espectro de aplicación para las ciencias –cuyos avances y desarrollos experimentales han abierto un nuevo paradigma mediante la creciente escalabilidad de la generación y del almacenamiento de información sumada a la capacidad automática de procesamiento–, potenciando las ya conocidas herramientas estadísticas para la identificación de patrones y correlaciones de grandes conjuntos de datos con la finalidad de desarrollar nuevos conocimientos (Schleder & Fazzio, 2021).

El proceso de modelado de aprendizaje supervisado empleado en la presente investigación difiere de otros que han sido implementados, tal como se muestra en la Tabla 1 (a esta Tabla corresponden el análisis de series de tiempo o de redes neuronales, ambos métodos tradicionales de estimación para el caso de productos de exportación como es el caso del camarón). Se ha optado por algoritmos de regresiones múltiples ampliamente utilizados para la predicción y clasificación. Inclusive, se han usado métodos no relacionados con estos como son el análisis ANOVA y prueba t, métodos que pueden representarse como modelos de regresión y, así, compartir un marco estadístico subyacente. Los modelos más complejos de regresión incluyen múltiples variables independientes y examinan la contribución única de cada uno hacia la variable dependiente (Britt et al., 2021) que, para el presente caso de estudio, busca probar dos teorías: que de la dependencia del PPCE recaerá en más de una variable y que su correlación con las ventas de la empresa del ramo son del tipo no lineales.

Tabla 1
Estado del arte métodos predictivos de machine learning
Estado del arte métodos predictivos de machine learning
Elaboración propia.

Materiales y Métodos

“La investigación emplea el método cuantitativo de correlación de datos longitudinales” (Cordero, 2021, p. 44), esto se realiza mediante el empleo de algoritmos predictivos de aprendizaje supervisado, mismo que utiliza datos históricos y transversales para una variable de interés pronosticando resultados a futuro (International Business Machines Corporation [IBM], 2020), los cuales se ajustan a la no linealidad en la que se desenvuelven los mercados bursátiles (Gupta et al., 2021).

La Figura 1 describe tres pasos principales. El primero consiste en la obtención de la información de entrada para el análisis de los principales factores que inciden en el PPCE. El segundo efectúa el proceso de análisis de los datos recabados previamente, depurados en hojas de cálculo y procesados a través del lenguaje de programación Python. El tercero, finalmente, corresponderá a la proyección de ingresos ordinarios para un escenario planteado de cinco años de la empresa, estos se equipararán con las similares realizadas por la calificadora de riesgos en la calificación para tercera emisión de obligaciones (Global Ratings, 2021a).

Modelado de aprendizaje supervisado para pronóstico de ventas de la empresa camaronera
Figura 1
Modelado de aprendizaje supervisado para pronóstico de ventas de la empresa camaronera
Elaboración propia.

Estrategia para cumplir el objetivo

La herramienta que se empleará para desarrollar el modelado de aprendizaje supervisado para enfocar las variables explicativas que impacten de forma significativa al PPCE será el método FODA (Abdel-Basset et al., 2018). Este modelo sirve para abarcar el contexto del negocio exportador de camarón y langostinos a escala macro para, posteriormente, aterrizarlo a nivel micro en la estimación de ventas de la empresa exportadora de camarón.

Modelado del aprendizaje supervisado

La secuencia que se deberá seguir para generar líneas de código en los modelos predictivos de regresión múltiple a través del lenguaje de programación Python está ampliamente difundida en la literatura, gracias al tener procedimientos genéricos en los tratados de ciencias de datos para el aprendizaje supervisado (Duchesnay et al., 2021), también conocido como procedimiento esquematizado río abajo.

Búsqueda en las bases de datos

Se tomarán datos estadísticos del mercado exportador ecuatoriano del camarón y langostinos, los cuales son de acceso público de la Cámara Nacional de Acuacultura del Ecuador [CNA] (CNA, 2022). Las fuentes de información extranjeras que serán consultadas se detallan a continuación:

Pre-procesamiento de los datos

El principal criterio para la realización de la búsqueda de los datos que las fuentes de información deben cumplir será que cuantifiquen la temporalidad de sus registros a partir de enero del año 2011 hasta junio de 2021, también deben ser consistentes. Se realizará un proceso de depuración de la data previo a someterse al análisis del modelo de predicción del PPCE, así poder obtener mejores resultados siguiendo con la forma tradicional de limpieza (Ridzuan & Zainon, 2019) mediante el empleo de una hoja de cálculo en la que constará lo siguiente:

Data frame depurado

Se configurará en cantidad y calidad de data frame morfológicamente constituido por 126 filas o registros y columnas o features. También será sometido preliminarmente a un exploratory data análisis (EDA) para discriminar qué variables son relevantes verificando su colinealidad y, así, constatar junto con las primeras visualizaciones que existan correlaciones que guíen a la construcción del modelo (Lazzeri, 2021). El coeficiente de determinación ajustado (o adjusted R-squared) deberá ser lo suficientemente alto como para definir el tamaño del data frame que alimentará al modelo de proyección del PPCE (Karch & Van Ravenzwaaij, 2020).

Codificación de los modelos predictivos para el PPCE

Con el data frame depurado denominado ‘eshrimp’ se codificará, en el lenguaje de programación Python, tres modelos de regresión múltiple (Duchesnay et al., 2021). Para los modelos que admitan aprendizaje automático se dividirá en dos el conjunto de datos: la primera de testing y la segunda de training (Ceder, 2018, p. 93). Esto se llevará a cabo aplicando el principio de Pareto 80-20, ampliamente utilizado en el campo de la economía y de los negocios (Investopedia, 2020).

Evaluación de modelos predictivos para el PPCE

Con un data frame denominado ‘proyección’, correspondiente a los últimos seis registros o primer semestre de 2021, se reemplazarán los valores de los interceptos y coeficientes de las variables explicativas en cada modelo. Se procederá a calcular sus respectivos root mean square error (RMSE) como criterio de medida de precisión para comparar los valores reales PPCE versus los valores predichos o denominados como errores de predicción (Neill & Hashemi, 2018, p. 216). Este método está acorde a la robustez de los modelos.

Implementación del modelo predictivo para el PPCE

Se harán predicciones a cinco años reemplazando los valores supuestos en promedios anuales en la ecuación predictora del modelo seleccionado con el menor RMSE. Estas predicciones deberán ser insesgadas y próximas a los valores verdaderos promedio, dando cumplimiento con el objetivo de la predicción. Inclusive, permitiendo que el ruido persista de forma arbitraria, lo cual es característico en todos los modelos lineales (Shmueli et al., 2019, p. 164).

Búsqueda de los estados de resultados a analizar

Se conjugan valores históricos anuales de los PPCE (CNA, 2022) e ingresos históricos de la empresa expresados entre los mismos periodos en su primera emisión de obligaciones (Global Ratings, 2021b).

Ajuste no lineal al modelo de predicción de ventas

Con los datos históricos de entrada se codificarán, en el lenguaje de programación Python, los ajustes a las predicciones de los PPCE. Esto se lo realizará en un modelo de interpolación polinomial (Virtanen et al., 2020) de grado tres para obtener la estimación de las ventas. Tal como se ha demostrado en los últimos años, es posible identificar las estructuras de los datos de los mercados financieros no lineales con machine learning (Fischer & Krauss, 2018).

Resultados en función del objetivo

A través de una gráfica en la hoja de cálculo Excel se mostrará el comparativo de las dos proyecciones de las ventas, proyecciones analizadas a través de la línea de tendencia en cada caso particular (Investopedia, 2021).

Análisis y Resultados

Para realizar la proyección de las ventas de camarón en el objeto de estudio práctico se siguieron las etapas detalladas en la metodología anterior. Los resultados fueron los siguiente.

Elementos de entrada del modelo de aprendizaje supervisado para ventas de camarón

Variable PPCE

La acuacultura es un sector que ha padecido de un rápido crecimiento comparativamente a la pesca de captura, siendo esta última superada en producción mundial desde el año 2014 (ESPAE, 2018, p. 8), de acuerdo a lo establecido por la Organización de las Naciones Unidas para la Alimentación y la Agricultura [FAO]. Acorde con el análisis de investigación publicado en el portal Business Wire (2021) se espera que la industria mundial del camarón crezca con una tasa compuesta anual del 4.18 % a partir de 2020 hasta el 2026.

El mercado —sobre las expectativas de crecimiento mundial del mercado de camarón, así como la incertidumbre que sufren la mayoría de los commodities (Global Ratings, 2021c)— enfrentó desafíos debido al bloqueo de Covid-19, lo que retrasó todas las operaciones, la reducción de tiempos de ciclo y generó controversias en mercados de destino. Pese a la baja de los precios internacionales en gran parte del año 2020 y su principal consecuencia traducida en pérdidas económicas, fueron los mercados minoristas los que afrontaron la crisis generada y, como se ha podido observar en el caso de China, en ese país se ha manifestado un auge en el sector de restaurantes, contando con total apertura en la actualidad.

Sin embargo, en el resto de Asia el mal temporal acuícola no distó del resto de regiones del mundo y vio afectada su producción según cifras reportadas durante el mes de abril, recayendo principalmente en la reducción del periodo de desarrollo del crustáceo. Los productores de camarón —al verse impedidos por las restricciones, sumados al pánico y a una mayor incertidumbre— optaron por bajar las densidades de población de camarón con el agravante de los precios bajos hasta agosto de 2020. La India padeció su mayor descenso entre abril y agosto del mismo año a niveles récords bajos tras fuertes contracciones de la demanda mundial, principalmente del sector de servicios alimentarios. Contrariamente, Vietnam e Indonesia denotaron cierta mejoría en términos comparativos (FAO, 2021).

El comportamiento del PPCE, a partir del año 2012, presentó una tendencia alcista, alcanzando su mejor momento de 4.05 dólares en febrero del 2014 y sufriendo una suerte de lacónica temporalidad, persistiendo a la baja hasta los valores mínimos registrados durante el año 2020 por consecuencia de la pandemia del Covid-19. Pese a ello, las cifras denotan una leve recuperación en los primeros meses del año 2021.

Variables relacionadas al PPCE

En la Tabla 2 se muestra el contexto mundial que incide en el PPCE. Esto conlleva a exponer qué variables relevantes están presentes en los países en las diferentes regiones, en lo correspondiente al mercado internacional de los recursos marinos y que mantienen el mayor protagonismo.

Tabla 2
Análisis FODA del sector camaronero ecuatoriano
FortalezasOportunidades
· El Ecuador ocupa el tercer puesto en términos de volumen de exportación en el ranking mundial camaronero (Business Wire, 2020). · Las exportaciones ecuatorianas de camarón superaron a las de banano como primer producto no petrolero (Sánchez et al., 2020).· Estados Unidos, como la mayor economía mundial desde los años 1920 en términos del PIB, se encuentra entre los países de mayor consumo del camarón sin cabeza, por sobre el consumo del salmón, gozando de preferencia dentro del mercado estadounidense acorde con el portal Seafood Source (2020). · La devaluación del dólar respecto al yuan volvería más competitiva a las exportaciones ecuatorianas. Se espera que la economía china crezca en 2022 (Fondo Monetario Internacional [FMI], 2021).
DebilidadesAmenazas
· La influencia de los precios del barril de crudo y de sus derivados envuelve a toda la cadena del camarón desde el abastecimiento, producción y logística dentro del comercio internacional del camarón. · La dolarización de la economía ecuatoriana no permite aplicar políticas monetarias para atender ventajas competitivas como es la posibilidad de reducir los costos, visto desde la perspectiva de sus principales contendores.· Las exportaciones de camarón procedentes de la India hacia el mercado destino estadounidense afectaron al camarón ecuatoriano (Global Ratings, 2021c, p. 266). Estas se han visto compensadas parcialmente por el incremento de las importaciones de camarón hacia el bloque asiático, específicamente al mercado chino. · El salmón, como de producto de explotación acuícola sustituto, guarda similitudes en cuanto a la cadena de suministros del camarón, así como preferencias entre los principales mercados de destino (FAO, 2021).
Elaboración propia.

Del análisis FODA se desprende que la variable ‘precio’ expresada en dólares por libra se correlacionará con seis variables explicativas a ser tomadas en cuenta para el modelo de regresión múltiple:

Modelo de aprendizaje supervisado para predicción del PPCE

Se recabaron registros cronológicos de fuentes consultadas a partir de enero 2011 y se pre-procesaron todos los datos brutos obtenidos de las siete variables que conforman data frame ‘eshrimp’. Esto se encuentra estructurado en 120 filas y siete columnas, cuyos indicadores estadísticos de cada variable se muestran en la Tabla 3.

El EDA, al ser el primer análisis, identifica el tipo de correlación más fuerte de 0.77 entre ‘Export’ e ‘Import’ y la más débil existente entre ‘EE.UU’ y ‘Export’ de 0.06. Además, se observa que a medida que cada una de las variables predictoras van adicionándose a la regresión múltiple, el valor del coeficiente de determinación ajustado registra un incremento (ver Figura 2). Este último como una medida más precisa del coeficiente de determinación (R.), compensando la adición de variables solo si el nuevo predictor mejora los resultados del modelo igual a 0.807 y, contrariamente, aminorará su valor frente a lo obtenido a efectos del azar (Investopedia, 2022).

Tabla 3
Resumen estadístico de las variables del modelo predictivo
EstadísticosPrecioEE.UUDólarExportImportCrudoSalmón
Count120120120120120120120
Mean2.9432512.9224176.51969 917 830130 270.2568.4015835.314333
Std.0.4405652.4555850.30565632 371 39070 552.1111924.0486851.289186
Min.2.318.716.0525 647 03020 49516.552.66
25 %2.567511.3956.2442 140 24073 257.548.694.455
50 %2.9712.3856.46564 281 810114 602.559.855.245
75 %3.112513.9056.79592 822 940183 463.7594.2256.0925
Max.4.0519.257.12159 145 800303 675109.538.37
Elaboración propia.

Figura 2
Resumen estadístico de la regresión múltiple
PrecioEE.UUDollarExportImportCrudoSalmonAdjusted R Square
Precio1.00
EE.UU0.721.000.513856864
Dólar-0.55-0.271.000.655183854
Export-0.34-0.060.751.000.655703763
Import-0.090.080.610.771.000.674945948
Crudo0.230.22-0.64-0.68-0.561.000.717988477
Salmón0.150.070.460.430.35-0.461.000.807195866
Elaboración propia.

Se procede a la generación de líneas de código para los modelos predictivos de regresión múltiple del lenguaje de programación Python, cuyo modo de empleo puede esquematizarse en el orden genérico:

Para efectos de maquetación de los tres modelos de regresión múltiple estos se instrumentalizan por intermedio de paquetes preconfigurados en el entorno del lenguaje de programación Python (Harris et al., 2020), distinguiéndose dos principales:

  1. 1. El Statmodels con el modelo básico de regresión lineal múltiple ordinary least square (OLS) proyecta parámetros aprendiendo de una serie única de datos basándose en la teoría de los mínimos cuadrados.
  2. 2. El paquete Sklearn con los dos modelos predictivos linear regression (MLR) y Ridge. Este último, como se observa en la Figura 3, efectúa pronósticos fijando mediante iteraciones un factor de penalización o Alpha con algoritmos de aprendizaje de la serie de datos ‘eshrimp’ particionados en 80/20, cuya ecuación de la regresión se sirve de la data frame ‘proyección’ para las estimaciones establecidas en las líneas de código formato IDE conexas.

Figura 3
Codificación del modelo Ridge
1# IMPORTAR LIBRERÍAS
2import pandas as pd
3import numpy as np
4import matplotlib.pyplot as plt
5from sklearn.model_selection import train_test_split as holdout
6from sklearn.linear_model import Ridge
7from sklearn import metrics
8from sklearn.metrics import mean_squared_error
9# ASIGNACIÓN DEL DATA FRAME ‘eshrimp’
10df = pd.read_csv(’eshrimp.csv')
11# RECONOCIMIENTO DE LAS VARIABLES
12X = df.drop(['precio'],axis=1)
13Y = df['precio']
14# PARTICIONAR EN DATOS PARA TESTING Y TRAINING (80-20)
15x_train,x_test,y_train,y_test = holdout(X,Y,test_size=0.2,random_state=0)
16Ridge = Ridge(alpha=1.46)
17model_ridge = Ridge.fit(x_train,y_train)
18y_pred_ridge = model_ridge.predict(x_test)
19# PREDICCION CON EL DATA FRAME «proyección»
20dfp = pd.read_csv('proyeccion.csv')
21x_pred = dfp[['eeuu','dollar','export','import','crudo','salmon']]
22yreal = dfp['precio']
23y_pred = model_ridge.predict(x_pred)
24seleccion = pd.DataFrame({'Actual':yreal,'Predicción':y_pred})
25#PRESENTACIÓN DE LAS PROYECCIONES DE LOS PPCE
26print(seleccion)
27print("RMSE RIDGE: ",np.sqrt(metrics.mean_squared_error(yreal,y_pred)))
Elaboración propia.

Selección del modelo para predicción del PPCE

Una vez codificados los tres modelos se representan gráficamente sus valores estimados, los mismos que contrastan con los valores reales de los PPCE como se muestra en la Figura 4. El criterio de evaluación para seleccionar el modelo es el RMSE, siendo el modelo Ridge el que muestra el error de 0.274 (Tabla 4). La técnica de regresión Ridge permite corregir la multicolinealidad en caso de que esta se presente. Esto evita que las variables importantes se descarten, también mantiene la consistencia del modelo luego de efectuar varias simulaciones verificando que el coeficiente Alpha de 1.46 sea el más adecuado frente al conjunto de siete variables presentes en la regresión y, en ciertos casos, con valores resultantes ligeramente superiores a los reales (Nunes et al., 2019).

Valores reales versus pronosticados del PPCE semestre 1 del año 2021
Figura 4
Valores reales versus pronosticados del PPCE semestre 1 del año 2021
Elaboración propia.

Tabla 4
Errores en los modelos de regresión múltiple
FechaReal (USD)Ridge (USD)MLR (USD)OLS (USD)
Ene-212.3522092.7998532.8724702.846161
Feb-212.2765582.5950322.6896872.673843
Mar-212.3726052.6579712.7649052.771776
Abr-212.4181472.4683532.6027142.610457
May-212.5206782.7775642.9545582.964879
Jun-212.7056572.7100012.8479622.848381
RMSE0.2748380.3737260.368793
Elaboración propia.

Predicción de los PPCE

La predicción de los PPCE corresponderá a cifras que estén bajo el control del analista. Los supuestos serán reemplazos en la ecuación de la predicción Ridge en cada una de las variables independientes a estimar para un escenario planteado como conservador para los próximos cinco años como horizonte de planificación. Los supuestos serán programados de la siguiente manera:

Tabla 5
Supuestos para predicción del PPCE
AñoEEUUDólarExportImportCrudoSalmón
202112.56.4148 000 000220 000685.8
2022136.1149 000 000230 000705.9
202313.55.9150 000 000240 000556
202413.755.7151 000 000250 000605.7
202513.45.8152 000 000260 000695.8
Elaboración propia.

Históricos de ventas de camarón

El modelo de predicción de ventas de camarón requiere aprender la información ya conocida. Esta información está compilada en la data de los PPCE, también es procesada de forma anual. La extracción de declaración financiera anexa de las ventas realizadas de camarón por parte de la empresa está disponible al público. Estos datos son extraídos para el mismo periodo de tiempo (Tabla 6).

Tabla 6
Histórico de los PPCE y de ventas de camarón
Variables20162017201820192020
PPCE$ 3.07$ 3.05$ 2.87$ 2.61$ 2.42
Ingresos (miles de dólares)$ 135 871$ 141 390$ 146 387$ 167 749$ 153 741
Elaboración propia.

Función de ajuste no lineal a las ventas de camarón

El modelo pronosticará las ventas de camarón mediante regresión polinomial, para lo cual se deberá definir, en función de los PPCE, el grado de la interpolación con mejor interacción entre las variables ventas de camarón y la variable de interés. Será la curva de tercer grado la que mejor se aproxime a la tendencia de los puntos, tal como se puede apreciar en la Figura 5.

Curvas ajustadas de segundo y tercer grado
Figura 5
Curvas ajustadas de segundo y tercer grado
Elaboración propia.

Codificación del modelo de aprendizaje supervisado para predicción de ventas de camarón

Con toda la información de entrada de rigor para configurar el modelo disponible se asigna ‘Y’ a la variable ventas de camarón y ‘X’ a los PPCE para automatizar las estimaciones. Una vez consensuada la interpolación polinomial se reemplazan los valores de las predicciones de los PPCE para, finalmente, presentar los resultados en pantalla. Tal como se muestra en la codificación de la Figura 6.

Figura 6
Líneas de código para pronóstico de ventas de camarón
1# IMPORTAR LIBRERÍAS
2from numpy import *
3from scipy.interpolate import *
4# ASIGNACIÓN DE LAS VARIABLES «X» y «Y»
5X=array([3.06966345091652,3.04781763623938,2.8682275719638, 2.61374542218584,2.42223365313198])
6Y=array([135871,141390,146387,167749,153741])
7# DEFINICIÓN DE LA REGRESIÓN POLINOMIAL
8Y_3=polyfit(X,Y,3)
9# ASIGNACIÓN DE LOS PPCE PROYECTADOS
10X_1=array([2.683438,2.9276343,3.1741427,3.2826879,3.1714807])
11# INTERPOLACIÓN POLINOMIAL GRADO 3
12yfit_1=Y_3[0]*X_1**3 + Y_3[1]*X_1**2 + Y_3[2]*X_1+ Y_3[3]
13#PRESENTACIÓN DE LOS RESULTADOS DE LAS VENTAS
14print(yfit_1)
Elaboración propia.

Resultados del modelo de aprendizaje supervisado para proyección de ventas de camarón

Empleando los resultados de la codificación del modelo y las proyecciones declaradas por parte de la calificadora de riesgos se elabora la tabla resumen (Tabla 7) para un horizonte de tiempo de cinco años, así como datos de origen para el análisis comparativo respectivo.

Tabla 7
Comparativo del pronóstico de ventas de camarón
Modelo20212022202320242025
BVG (miles de dólares)$ 135 293$ 142 057$ 149 160$ 156 618$ 164 449
Python (miles de dólares)$ 164 039$ 142 315$ 148 088$ 174 269$ 147 673
Elaboración propia.

Análisis comparativo de las proyecciones de ventas de camarón

Las líneas de tendencia que se muestran en la Figura 7 indican que las ventas históricamente han mostrado un comportamiento no lineal, así como los resultados de las proyecciones del modelo en el presente estudio. Existen más variables intervinientes en lo referente a las ventas de camarón, estas variables han sido consideradas en esta investigación. Pero, para efectos del modelado, serán excluidas siempre que el horizonte de planificación no supere al corto plazo y no se realicen inversiones en activos fijos importantes que incidan en la capacidad instalada productiva de la empresa.

Tendencias de la venta de camarón
Figura 7
Tendencias de la venta de camarón
Elaboración propia.

Discusión y Conclusiones

Del aprendizaje supervisado se han empleado regresiones principalmente dada su utilidad y practicidad. Mismas que, a la par, permiten obtener predicciones razonables de la variable que se desea investigar y, además, deja abierta la posibilidad de adicionar una mayor cantidad de variables que se sospechen tendrán impacto al final (Darski et al., 2020). En este grupo existe una amplia variedad de modelos, desde los lineales hasta los no lineales. Como en este caso de estudio, los autores de otros trabajos sugieren incursionar hacia la hibridación entre modelos lineales y no lineales, considerados así los que atienden los problemas presentando una estructura con ambos patrones (Barchi et al., 2021).

Todo lo que representa la cadena de valor del camarón en el caso ecuatoriano ocurre también en otros países competidores a nivel mundial en este commodity, tales como Vietnam, con el diferencial de que en su haber dispone de todo un contingente para atender este transcendental segmento desde lo público (Ministry of Planning and Investment of Vietnam [AED], 2022) hasta llegar a las arquitecturas de información para investigación y desarrollo en lo privado (Portal of Vietnam Association of Seafood Exporters and Producers [VASEP], 2021), a fin de poder hacer frente a innumerables problemas que se presentan en la explotación de los recursos marinos.

En el desarrollo de investigaciones con uso de herramientas de machine learning, Brasil las aplica para los casos de estudio de sus productos emblemáticos a nivel mundial, reconocidos en mercados internacionales en lo referente al aporte a la economía y al empleo en ese país, tal como sucede con el café (Deina et al., 2019). Inclusive, emplean algoritmos de inteligencia artificial más evolucionados para abarcar más objetos de estudio y poder hacer frente a la incertidumbre por medio del análisis completo de escenarios futuros con respecto a las materias primas que se relacionan entre sí, las cuales conllevan un alto impacto multisectorial al producto interno bruto brasileño, como lo observado con el tejido agroindustrial de la caña de azúcar conjuntamente con el etanol (Pereira, 2021).

Los resultados de las predicciones de ventas de camarón del presente trabajo están supeditadas a cubrir las expectativas de la empresa, en términos más próximos a la realidad sobre el manejo de su capital de trabajo y para mantener prudencia sobre las decisiones financieras. Ello, mediante mecanismos no tradicionales con fundamentos estadísticos respecto a los presupuestos a realizarse sobre la estructura de su capital y en su verdadera generación de valor. Gestión que en el corto plazo debe mantenerse para continuidad de las operaciones, sorteando posibles riesgos de liquidez e impacto directo sobre su rentabilidad (Meah et al., 2021; Rojas et al., 2021).

A lo largo de este estudio se logró consolidar un piloto de aprendizaje supervisado para realizar el pronóstico de venta de camarón en dos fases. La primera, correlacionando seis variables independientes a la proyección de los PPCE. La segunda, ajustando de forma no lineal los datos históricos de cinco años de la empresa. Lo anterior puede verse como una apuesta preliminar susceptible de mejorar mediante la incorporación de más variables y de la mano con el acceso a la información. Misma que posee limitaciones por los costos de licencias del uso de las bases de datos para dotar de mayor complejidad y robustez a los modelos de machine learning para futuras investigaciones.

Referencias

Abdel-Basset, M., Mohamed, M., & Smarandache, F. (2018). An Extension of Neutrosophic AHP-SWOT Analysis for Strategic Planning and Decision-Making. Symmetry, 10(4), 116.

Abdellatief, M., Shaaban, E.M., & Abu-Raya, K.A. (2019). Egyptian Case Study-Sales forecasting model for automotive section. 2019 International Conference on Smart Applications, Communications and Networking (SmartNets), 1-6. https://doi.org/10.1109/SmartNets48225.2019.9069751

Altaf, N., & Shah, F.A. (2021). Working Capital and Capital Structure. In Capital Structure Dynamics in Indian MSMEs. Palgrave Macmillan, Singapore. pp. 61-74.

Barchi, T., Bassetto, P., Biuk, L., Costa, L., Puchta E., Corrêa, F., Andrade, M., Kachba, Y., & Siqueira, H. (2021). Previsão do preço do açúcar: uma análise comparativa entre modelo linear e redes neurais. Resumen de presentación de la conferencia en Congresso Brasileiro de Inteligência Computacional. http://dx.doi.org/10.21528/CBIC2021-81

Britt, C., Wooditch, A., Weisburd, D., & Wilson, D. B. (2021). Advanced Statistics in Criminology and Criminal Justice. Springer, Cham. https://doi.org/10.1007/978-3-030-67738-1_2

Business Wire. (24 de febrero de 2020). Shrimp Still Dominating American Seafood Preferences, According to NFI’s Annual List. https://bit.ly/3FYV8Uj

Business Wire. (30 de abril del 2021). Global Shrimp Market Report 2021-2026: Production, Export, Import, Consumption, Countries, Species, Product Form, Size, Value Chain. Analysis & Forecasts. ResearchAndMarkets.com. https://bwnews.pr/32Bg9G3

Cámara Nacional de Acuacultura del Ecuador [CNA]. (01 de febrero del 2022). Estadísticas: camarón- reporte de exportaciones ecuatorianas totales. https://bit.ly/3qNTHDC

Darski, C., Kuhl, C.P., Capp, E., & Nienov, O.H. (2020). Conceitos básicos em estatística e epidemiologia. Bioestatística quantitativa aplicada. UFRGS. pp. 17-40.

Ceder, N. (2018). The quick Python book. Simon and Schuster.

Cordero, B. (2021). Modelo de evaluación de crédito para capital de trabajo utilizando lenguaje Python aplicado a la banca pública: Caso de estudio en proyecto camaronero. Cuestiones Económicas, 31(3). https://bit.ly/3nZ3mpe

Deina, C., Do Amaral, M., Rodrigues, C., Ribeiro, M., Siquiera, H., & Trojan, F. (2–6 de septiembre de 2019). Comparação do desempenho entre modelos lineares e redes neurais para previsão do preço do café. Discurso principal en LI Simpósio Brasileiro de Pesquisa Operacional, Limera, Brasil. https://bit.ly/3ldW3YN

Dos Santos, J. A. A. (2022). Previsão do preço do café arábica: uma aplicação de redes neurais CNN-BLSTM. Research, Society and Development, 11(3), e3511326101.

Duchesnay, E., Lofstedt, T., & Younes, F. (2021). Statistics and Machine Learning in Python. Engineering School. Hal Open Science (hal-03038776v3). https://bit.ly/3DLPupd

ESPAE Graduate School of Management. (2018). Estudios Industriales: orientación estratégica para la toma de decisiones-Industria de Acuicultura.

Fischer, T., & Krauss, C. (2018). Deep Learning with Long Short-Term Memory Networks for Financial Market Predictions. European Journal of Operational Research, 270(2), 654-669.

Fondo Monetario Internacional [FMI]. (11 de octubre del 2021). Perspectivas de la economía mundial: la recuperación en tiempos de pandemia. https://bit.ly/3EcIOiC

Gabel, F. (10 de julio de 2019). Some Studies in Machine Learning Using the Game of Checkers [Applied Computer Science Course]. Artificial Intelligence for Games: Seminar, Heidelberg, Alemania.

García Regalado, J.O., Zavala Vinces, J., & Sánchez Giler, S. (2020). Factores determinantes en la adopción de crédito de proveedores de las pequeñas empresas manufactureras del Ecuador y su efecto en el incremento de su producción. Revista de Métodos Cuantitativos para la Economía y la Empresa, 29, 275-301. https://doi.org/10.46661/revmetodoscuanteconempresa.3866

Global Ratings. (2021a). Calificación segundo programa de papel comercial Promarisco S.A.https://bit.ly/3pdOZg3

Global Ratings. (2021b). Calificación primera emisión de obligaciones empacadora grupo Granmar S.A. Empagran. https://bit.ly/3kPtUXP

Global Ratings. (2021c). Calificación tercera emisión de obligaciones empacadora grupo Granmar S.A. Empagran. https://bit.ly/3I4hF43

Gordillo, J., López, M., Guevara, M., & Pérez, J. (13 de marzo de 2022). Análisis del comportamiento de las exportaciones ecuatorianas de camarón pertenecientes al sector acuacultura antes y después del COVID-19 periodo marzo 2019-febrero 2020 y marzo 2020-febrero2021. Universidad Politécnica Salesiana. https://bit.ly/3vuHh5J

Gupta, B.K., Mallick, M.K., & Hota, S. (2021). Survey on Stock Price Forecasting Using Regression Analysis. In Intelligent and Cloud Computing (pp. 147-156). Springer.

Gutiérrez Ponce, H., Morán Montalvo, C., & Posas Murillo, R. (2019). Determinantes de la estructura de capital: un estudio empírico del sector manufacturero en Ecuador. Contaduría y administración, 64(2). https://doi.org/10.22201/fca.24488410e.2018.1848

Harris, C.R., Millman, K.J., Van Der Walt, S.J., Gommers, R., Virtanen, P., Cournapeau, D., & Oliphant, T.E. (2020). Array Programming with NumPy. Nature, 585(7825), 357-362.

International Business Machines Corporation [IBM]. (19 de agosto del 2020). Supervised Learning. https://ibm.co/3FzWXdj

Investopedia. (25 de mayo del 2020). 80-20 Rule. https://bit.ly/3G064Rn

Investopedia. (19 de agosto del 2021). Trendline.https://bit.ly/3P8prx0

Investopedia. (11 de febrero del 2022). R-Squared vs. Adjusted R-Squared: What’s the Difference?https://bit.ly/3a0o2sr

Karch, J., & Van Ravenzwaaij, D. (2020). Improving on Adjusted R-squared. Collabra: Psychology, 6(1).

Khiem, N.M., Takahashi, Y., Dong, K.T.P., Yasuma, H., & Kimura, N. (2021). Predicting the Price of Vietnamese Shrimp Products Exported to the US Market Using Machine Learning. Fisheries Science, 87(3), 411-423.

Lazzeri, F. (2021). Machine Learning for Time Series Forecasting with Python. John Wiley & Sons.

Lucien-Brun, H. (2018). Ecuadorian Shrimp Farming: From falilure to success. Aqua Culture Asia Pacific. https://bit.ly/3s3xrFA

Ministry of Planning and Investment of Vietnam [AED]. (2022). THÔNG tin xuất khẩu vào thị trường EU: Mặt hàng thủy sản. https://bit.ly/3N4iMSR

Meah, M.R., Sen, K.K., & Sahabuddin, M. (2021). Do Working Capital Decision and Efficiency of Working Capital Management Contribute to the Profitability? Evidence from Bangladesh. Asia-Pacific Journal of Management Research and Innovation, 17(1-2), 7-16.

Mojjada, R.K., Yadav, A., Prabhu, A.V., & Natarajan, Y. (2020). Machine Learning Models for Covid-19 Future Forecasting. Materials Today: Proceedings.

Muangsrisun, D., Jatuporn, C., Seerasarn, N., & Wanaset, A. (2021). Factors Influencing Farm-Gate Shrimp Prices in Thailand: An Empirical Study Using the Time Series Method. The Journal of Asian Finance, Economics and Business, 8(5), 769-775

Neill, S.P., & Hashemi, M.R. (2018). Fundamentals of Ocean Renewable Energy: Generating Electricity from the Sea. Academic Press.

Nunes, D.B., Barros, J.D.P., & Freitas, S.M.D. (2019). Multiple Linear Regression Model to Evaluate the Market Value of Residential Apartments in Fortaleza, CE. Ambiente Construido, 19, 89-104.

Organización de las Naciones Unidas para la Alimentación y la Agricultura [FAO]. (07 de enero de 2021). GLOBEFISH - Información y análisis sobre el comercio mundial de pescado. https://bit.ly/3G0fjBc

Pereira, J. W. A. (2021). Uma análise do impacto do preço do açúcar no preço do etanol (2007-2017). Editora Científica Digital. https://doi.org/10.37885/201202631

Portal of Vietnam Association of Seafood Exporters and Producers [VASEP]. (22 de diciembre del 2021). Report on Vietnam shrimp sector, 2016-2021, forecast to 2025. https://bit.ly/392yQ8V

Ridzuan, F., & Zainon, W. M. N. W. (2019). A Review on Data Cleansing Methods for Big Data. Procedia Computer Science, 161, 731-738.

Rojas, G., Romero, R., Pacheco, R., Villalobos, C., & Gómez, A. (2021). Modelado estadístico para la gestión de los primeros tres meses de la COVID-19 en Costa Rica. Estudios de la Gestión: Revista Internacional de Administración, (10), 55-74. https://doi.org/10.32719/25506641.2021.10.3

Sánchez, A., Vayas, T., Mayorga, F., & Freire, C. (25 de mayo del 2020). Acuicultura y pesca de camarón. Observatorio Económico y Social de Tungurahua. https://bit.ly/3p8Hxmw

Schleder, G.R., & Fazzio, A. (2021). Machine Learning na Física, Química, e Ciência de Materiais: Descoberta e Design de Materiais. Revista Brasileira de Ensino de Física, 43.

Seafood Source. (24 de febrero de 2020). Shrimp Still Dominating American Seafood Preferences, According to NFI’s Annual List. https://bit.ly/3FYV8Uj

Shmueli, G., Bruce, P.C., Gedeck, P., & Patel, N.R. (2019). Data Mining for Business Analytics: Concepts, Techniques and Applications in Python. John Wiley & Sons.

Singh, R., & Siddiqui, A. A. (2021). Identifying Markets and Forecasting Export Prospects for India’s Marine Products. International Journal of Business and Economics, 20(1), 57-72.

Tenorio-Vilaña, A. F., & Mideros-Mora, A. I. (2022). Teoría de la Preferencia Revelada para Analizar el Comportamiento del Consumidor de Zapatos de Correr. Economía y Negocios, 13(1), 40-60. https://doi.org/10.29019/eyn.v13i1.1015

Virtanen, P., Gommers, R., Oliphant, T.E., Haberland, M., Reddy, T., Cournapeau, D., & Van Mulbregt, P. (2020). SciPy 1.0: Fundamental Algorithms for Scientific Computing in Python. Nature methods, 17(3), 261-272.

HTML generated from XML JATS by