Investigación
Identificación de patrones de variabilidad climática a partir de Análisis de Componentes Principales, Fourier y Clúster k-medias.
Identificación de patrones de variabilidad climática a partir de Análisis de Componentes Principales, Fourier y Clúster k-medias.
Tecnura, vol. 20, núm. 50, pp. 55-68, 2016
Universidad Distrital Francisco José de Caldas
Resumen: Contexto: Una investigación mediante el Análisis de Componentes Principales (APC) se llevó a cabo para identificar la variabilidad y los patrones climáticos de dos importantes ciudades del Caribe Colombiano. Método: Para el desarrollo de este trabajo se empleó información satelital de resolución temporal trihoraria de 35 años (1980-2014) y se efectuó escalamiento espacial mediante información in situ para dos ciudades en Colombia (Cartagena y Barraquilla). Resultados: Los resultados de correlación superiores al 80% permitieron efectuar un adecuado ajuste para el análisis de información de velocidad de viento y temperatura ambiente. Para cada una de las 4 series de tiempo se construyó una matriz de empotramiento y de desfase con el objetivo de aplicar análisis de componentes principales o conocido también como análisis espectral singular. Fueron identificados los componentes principales cuya representatividad es inmediatamente superior al 70% para la temperatura y para el viento en ambas ciudades. Se efectuó un análisis de Fourier a la velocidad del viento y la temperatura y se detectaron modos de oscilación similares a los modos de oscilación (componentes principales) detectados mediante el APC. Conclusiones: Se encontró una variabilidad diurna para temperatura, y variabilidad diurna del viento para la ciudad de Cartagena, explicada por las brisas de mar y de tierra. Adicionalmente se encontró variabilidad trimestral asociada a las oscilaciones Maden Julian, variabilidades semestrales, anuales, y variabilidad de 6 años relacionada con el fenómeno del Niño. Finalmente mediante análisis de clúster se identificaron dos patrones climáticos en las zonas de estudio.
Palabras clave: Clima, Temperatura, Velocidad del viento, Componentes Principales, Fourier. Clúster.
Abstract: Context: Is achieved a research through Principal Component Analysis (PCA) for determining the variability and climate patterns of two important cities in the Colombia Caribbean. Method: This research used satellite data with three hourly resolution contained in a 35 year data set (1980 to 2014), and a spatial scaling was performed using information related to Cartagena and Barranquilla cities, located in the north of Colombia. Results: The correlation results, above 80 %, show an appropriate adjustment for the information analysis of wind speed and temperature. Time lag matrixes were built for the time series with the aim of applying the Principal Component Analysis (PCA), known as Singular Spectrum Analysis. The main components were identified, which represent more than 70% of the temperature and the wind data in both cities. A Fourier analysis for the wind speed and the temperature allowed identifying similar oscillation modes (main components) detected by the PCA. Conclusions: Sea and land breezes explain the identified diurnal temperature and wind speed variability in Cartagena. Additionally were observe a quarterly variability associated with fluctuations Maden Julian, semiannual, annual, and 6-year variability associated with ENSO. Finally, the cluster analysis allowed the identification of two-climate pattern in the study area.
Keywords: Climate, Temperature, Wind speed, Principal Components, Fourier, Cluster..
INTRODUCCIÓN
Los procesos físicos que se dan en la atmósfera presentan un carácter dinámico, aleatorio y de diferente naturaleza, lo que los convierte en fenómenos complejos de comprender y cuantificar. Para estudiar los efectos que en los sistemas ambientales y la infraestructura producen dichos procesos es necesario caracterizar a detalle los cambios que se dan en las componentes de viento, la temperatura, la radiación solar, etc., desde escalas a corto, mediano y largo plazo. En ingeniería es muy importante caracterizar las componentes de viento, precipitación, oleaje, caudal para el diseño de infraestructura hidráulica o para la definición de sistemas de gestión de riesgo. Para el pronóstico de estas variables se emplean comúnmente modelos estocásticos que permiten obtener con base en series de tiempo conocidas, el comportamiento futuro de los parámetros físicos evaluados en una localidad específica con espectros de aplicación limitada a la escala espacio-temporal del fenómeno que está siendo evaluando.
Skittides y Früh (2014) emplean el Análisis de Componentes Principales (ACP) para estimar los campos de viento, basados en el comportamiento de los procesos físicos en el pasado para predecir eventos futuros de naturaleza dinámica. Los modelos ACP demostraron ser una gran herramienta en la predicción de datos de viento con información medida y con información generada con datos multivariados. El potencial de esta técnica se basa en la capacidad de pronosticar el error probable que será obtenido y en efectuar pronósticos a partir de un conjunto de eventos pasados de características similares, lo que permite generar series sintéticas de gran precisión en el instante que la información es generada.
Rojo-Hernández y Carvajal-Serna (2010) estudiaron la dinámica no lineal de los caudales de los ríos de Colombia utilizando un modelo periódico de predicción basado en el Análisis Espectral Singular (AES), el cual deriva su funcionamiento en los métodos ACP. El estudio se enfocó en estudiar los ciclos que influyen sobre la dinámica de las series de caudales a partir del empleo ACP mediante la aplicación de regresiones lineales múltiples, bien sobre componentes principales o mediante componentes reconstruidas e involucrando variables climáticas macro rezagadas en el tiempo.
Carvajal y Marco (2004) llevaron a cabo un estudio de ACP a 50 estaciones de precipitación mensual y 8 estaciones de caudal con el fin de verificar la asociación entre variables macro climáticas relacionadas con el fenómeno ENSO (El Niño Oscilación del Sur) y la hidrometeorología del Valle del Cauca, Colombia. Encontraron que al emplear esta metodología en la modelación de la precipitación y el caudal se obtiene un mejor ajuste de los modelos regresivos.
En la investigación realizada por Giraldo F, et al (2013) se empleó el método K-means para inicializar algoritmos particionales aplicados al proceso de minería de flujo de datos.
Los investigadores Plazas-Nossa L y Torres A (2014) combinaron la técnica de PCA y Fourier con el objetivo de pronosticar series de tiempo obtenidas mediante la técnica de espectrotometría UV-Vis, quienes recomendaron efectuar los análisis de los rangos de los espectros UV y Vis de manera independiente facilitando así la identificación de los componentes principales y los armónicos fundamentales.
Miao, et al (2015), utilizaron, el método K-medias (K-means) tradicional con el método Spectral Clustering (SC), conformando SKC ( Spectralanalysis- basado K-means Clustering ), para la medición de la fuerza y la velocidad del viento, como recurso potencialmente aprovechable en le generación de energía limpia. Mo & Ghil (1988), hacen uso de un método de análisis de clúster modificado para identificar patrones espaciales de flujo del viento en el planeta, y su interacción. Skapa et al (2012), utilizan el agrupamiento k-means para identificar los fenómenos climáticos que tienen efectos sobre la propagación de las ondas de radio en telecomunicaciones móviles, y a su vez centran su trabajo en analizar los parámetros meteorológicos importantes como los resultados de k – medias. Kumar et al (2012), utilizaron los resultados numéricos generados a través de la función de densidad de probabilidad como la base de las recomendaciones a favor del agrupamiento K-medias para las predicciones relacionadas con el clima, haciendo uso de información de Quinland.
En Colombia el comportamiento de estos elementos es variable, lo que induce un alto porcentaje de incertidumbre dado que su predicción no es fácil de lograr. Por lo general, la información disponible proviene de estaciones ubicadas geográficamente en diferentes lugares, las cuales cuentan con dispositivos que miden a escala local el comportamiento de algunas o todas las variables mencionadas; sin embargo, su estado, la tecnología utilizada y su calibración pueden generar valores de medición con un porcentaje de error, o en muchos casos por falta de mantenimiento, pueden presentarse períodos de tiempo sin información. Otra fuente de información son los satélites artificiales, los cuales proveen de manera constante una lectura de información, pero, que puede verse afectada en su exactitud por la altura o distancia al punto de medición.
El objetivo del presente trabajo es identificar patrones de comportamiento de velocidad del viento y temperatura en localidades donde la disponibilidad de información es limitada: Se empleó información de Reanálisis localmente ajustada con información in situ, y se analizó la variabilidad climática mediante análisis de componentes principales, Fourier y Clúster k-medias.
METODOLOGÍA.
MANEJO DE LA INFORMACIÓN.
Con el objetivo de asimilar los datos de reanálisis pertenecientes a la base de datos NCEP North American Regional Reanalysis NARR, (NOAA, 2015), para ser escalados localmente a nuestros puntos de estudio, se decidió efectuar un análisis de regresión lineal para ajustar la información de 30 años trihoraria (NARR), empleando información horaria de 2013 y 2014 de las estaciones climáticas ubicadas en los aeropuertos de Barranquilla y Cartagena (IDEAM, 2016).
PRONÓSTICO BASADO EN ANÁLISIS DE COMPONENTES PRINCIPALES
Una forma de entender la dinámica de las series de tiempo climatológicas es a través del análisis espectral singular (AES), que en términos generales es la aplicación del análisis de componentes principales (ACP) a series de tiempo acomodadas de tal forma que las variables estudiadas son lapsos de tiempo establecidos (Elsner & Tsonis, 2013). El tratamiento de los datos se hace mediante la aplicación del teorema de Takens (1980), para la construcción de una matriz de retrasos, la cual permite obtener una mejor condensación de los datos y de su patrón dinámico o de oscilación, eliminando posibles señales de ruido.
La matriz se construye a partir de un vector de retrasos, de dimensión M, la ventana de tiempo escogida para la modelación de los datos, y con un tiempo de retraso (Ecuación 1) (Skitties & Früh, 2014)
(1)De esta forma la matriz de retraso queda con las siguientes dimensiones para Nd datos de la serie de tiempo.
Filas:N=Na-Mt+t ; Columnas: M.
El análisis de componentes principales se hace obteniendo la matriz de varianza-covarianza para la matriz de retrasos, y luego hallando los eigenvalores y los eigenvectores de acuerdo a la ecuación 3.
(2)Donde A es la matriz de varianza-covarianza, ei los eigenvectores, que representan la contribución de cada variable a la señal original y li los eigenvalores, que expresan la variabilidad asociada a cada eigenvector.
Una reconstrucción de la señal original se puede lograr al proyectar los eigenvalores sobre la matriz de datos originales X(t) mediante la ecuación 3.
(3)Donde Yi(t) son los componentes principales asociados a cada eigenvector ei. Al final mediante la ecuación (4) se puede reconstruir la señal como la sumatoria de los Yi(t) (García-Cabrejo, Moreno-Sánchez, 2006).
(4)El análisis de componentes principales se logró mediante la aplicación de los supuestos teóricos anteriormente mencionados. Primero se obtuvo la matriz de retrazos para valores de ventana M de 3 dias, 1 mes, 6 meses, 1 año y 6 años, con el fin de determinar la ventana de tiempo que ofrecía un mejor ajuste de los datos. Segundo se obtuvieron los eigenvectores y los eigenvalores según la ecuacion (3) y con los eigenvalores, se extrajo información acerca de la varianza acumulada explicada por los eigenvectores.
Seguidamente se determinó el número de eigenvectores necesarios para modelar los datos, sin incluir ruido en el modelo, esto se hizo teniendo en cuenta que los eigenvectores explicaran más del 70% de la variabilidad total del sistema. Se proyectaron todos los eigenvectores sobre la serie de datos original, tanto para la temperatura como para la velocidad del viento de Barranquilla y Cartagena respectivamente, para espacios de tiempo de 25 años y luego se modelarón de 3 dias, 1 mes, 6 meses, 1 año y 6 años para observar patrones de oscilacion y relacionarlos con fenómenos naturales. Finalmente se realizó la sumatoria de los componentes encontrados según la ecuación (5). El ajuste de la señal proyectada con los datos originales de la serie de tiempo se midió por medio del cálculo del coeficiente de correlación.
PRONÓSTICO BASADO EN ANÁLISIS DE FOURIER
En líneas generales el método del análisis armónico consiste en obtener, a partir de un registro horario de datos de estaciones y satélites, las amplitudes y fases de las ondas componentes. A estos parámetros se les llama componentes armónicas, debido a la suposición implícita de que los fenómenos no cambian en el tiempo. En este caso el método que se va a presentar es el elaborado por (Dronkers JJ, Johan Schonfeld, 1959) y basado en los mínimos cuadrados.
La velocidad del viento y la temperatura, se aproximan entonces, a la suma de esas ondas constituyentes a partir de los coeficientes de Fourier (Ecuación 5).
(5) Donde,

Δt: es el intervalo de muestreo o de registro.
N:Número de observaciones de nuestra serie de tiempo, K: es el armónico, : es la frecuencia del k-ésimo armónico en radianes, M: número de armónicos a determinar.
La frecuencia mínima que podemos determinar a partir de los registros de medición o de las observaciones es (Ecuación 6)
(6)La frecuencia máxima que podemos determinar de nuestras mediciones es (Ecuación 7)
(7) Cumpliéndose que:
Los coeficientes de Fourier se calculan:
(8)
(9)
(10)
(11)Nuestra señal quedará construida mediante la ecuacion 12
(12)Donde.
(13)ck^2=ak^2+bk^2 amplitudes de los armónicos
(14)θk=tan^-1bk/ak = fases de los armónicos
IDENTIFICACIÓN DE PATRONES DE ASOCIACIÓN BIVARIADO MEDIANTE ANÁLISIS DE CLUSTER K-MEDIAS.
En busca de identificar si existen patrones de agrupación entre la velocidad del viento y la temperatura ambiente para cada una de las dos ciudades, se efectuó un análisis de clúster mediante el método del k-medias (k-means clustering). Para determinar el número de grupos de una manera cuantitativa, se empleó el método de identificación de silueta (Silhouette).
El análisis de clúster (conglomerados) es una técnica multivariante que busca agrupar elementos (o variables) tratando de lograr la máxima homogeneidad posible en cada grupo y marcadas diferencias entre ellos; se puede combinar con otras técnicas como el ACP, y de esta forma reducir el volumen de los datos correlacionados, en un número de componentes principales representativos no correlacionados, y posteriormente hacer un análisis clúster sobre los componentes obtenidos.
Distancia Euclídea:(15)
d2 (xi, xj)= =

La técnica de análisis de clúster ha tenido aplicaciones en diferentes áreas, y puede ser de tipo jerárquico o no jerárquico; para el caso del no jerárquico se puede hacer uso de la metodología de k medias (k-means). En ésta metodología se seleccionan unos valores considerados base de cada conglomerado, para agrupar en torno a ellos todos los elementos que se encuentren dentro de una determinada distancia. Se toman los k primeros casos como grupos unitarios y se asignan el resto de casos a los grupos con el centroide más próximo, después de cada asignación se recalculan los centroides y se vuelven a asignar los individuos al centroide más próximo; iterando hasta que ningún individuo cambie de grupo cuando se haga la reasignación, de forma que tenga un comportamiento convergente.
RESULTADOS.
MANEJO DE LA INFORMACIÓN
Las Tablas 1 y 2, presentan el ajuste de los datos NARR, junto con los de las estaciones climatológicas del IDEAM. Con base en los estadísticos de regresión para los datos de velocidad del viento y de temperatura de las ciudades de Barranquilla y Cartagena, se infirió que el ajuste era adecuado, y permitía establecer una interpolación para obtener la información trihoraria desde enero 01 de 1980 hasta diciembre 31 de 2014 de las series de tiempo bajo estudio.
| Estadísticos Ciudades | CCM | R2 | Intercepto | Pendiente |
| Barranquilla | 0,84 | 0,71 | 0 | 0,6 |
| Cartagena | 0,7 | 0,49 | 0 | 0,47 |
| Estadísticos Ciudades | CCM | R2 | Intercepto | Pendiente |
| Barranquilla | 0,99 | 0,98 | 0 | 0,984 |
| Cartagena | 0.99 | 0.99 | 0 | 0.995 |
La Figura 1 presenta, a manera de ilustración, las series de tiempo tri-horarias de los datos tomados de NARR y los del IDEAM, junto con los NARR ajustados de acuerdo al modelo obtenido para la velocidad del viento en Barranquilla, Colombia.

PRONÓSTICO BASADO EN ACP
La escogencia del tamaño de la ventana se realizó basado en el coeficiente de correlación del modelo obtenido por ACP, en la Figura 2 se puede observar que a medida que se aumentó el tamaño de la ventana para los datos de temperatura y velocidadad del viento de Barranquilla y Cartagena respectivamente, el coeficiente de correlación se disminuyó significativamente.


El gráfico de sedimentación en el cual se muestran los eigenvalores li, o autovalores, se presenta en la Figura 3 de aquí podemos observar que a partir de cierto número de componentes los autovalores permanecen constantes.

Finalmente al proyectar los eigenvalores escogídos sobre la serie original se obtuvo el pronóstico a 25 años para velocidad del viento para la ciudad de Cartagena con cambio de ventana de 3 días. En la Figura 4 se exhibe la comparación de la proyeccion lograda con la serie original.

PRONÓSTICO BASADO EN ANÁLISIS DE FOURIER
Con base en el periodograma (Figura 5a) de la velocidad del viento para la ciudad de Barranquilla se identificaron ciclos de variabilidad de 8, 12, 24 horas, 81, 109.5. 156.41, 312.87 días, 2 años y 6 años. Estos ciclos de oscilación se asocian a la variabilidad natural del parámetro, donde el ciclo de 6 años se encuentre relacionado con el Fenómeno del Niño.

Inspeccionando los resultados de análisis espectral para temperatura ambiente en la ciudad de Cartagena, (Figura 6b) se identificaron ciclos de variabilidad de 24 horas, 109.5 días, 312.87 días, 2 años y 6 años. Estos ciclos de oscilación se asociación a la variabilidad natural del parámetro, donde el ciclo de 6 años este posiblemente relacionado con el Fenómeno del Niño.

Los modos de oscilación natural para la ciudad de Barranquilla (Figura 5 y Figura 6) fueron similares a los de Cartagena, en donde se observó un ciclo diurno, cuasi trimestral, anual, de 2 y 6 años. El ciclo cuasi trimestral puede estar asociado a los cambios de estación relacionados con los solsticios y equinoccios.
Se efectuaron las pruebas de sensibilidad mediante la variación del lapso de tiempo del conjunto de datos al cual se le efectuó el análisis de Fourier, y la variación del tiempo de modelación para las 2 ciudades obteniéndose modelos muy similares. Efectuadas las pruebas se encontró que para la ciudad de Barranquilla, se obtuvo un modelo de Fourier para el pronóstico del viento empleando una serie de tiempo trihoraria la cual debe tener un lapso de 6 años. Con base en lo anterior se obtuvo al comparar los resultados del modelo con la información satelital ajustada, un coeficiente de determinación de 0.9432 y un p-valor significativo de 0 (Tabla 3).
| lapso de tiempo 6 años | ||||
| Velocidad del viento | Temperatura ambiente | |||
| Pronóstico | p-valor | R2 | p-valor | R2 |
| 3 días | 0 | 0.9917 | 0 | 0.9949 |
| 7 días | 0 | 0.9646 | 0 | 0.9956 |
| 15 días | 0 | 0.9844 | 0 | 0.9782 |
| 1 mes | 0 | 0.9823 | 0 | 0.9839 |
| 3 meses | 0 | 0.9617 | 0 | 0.9679 |
| 6 meses | 0 | 0.9432 | 0 | 0.9263 |
| 12 meses | 0 | 0.7631 | 0 | 0.786 |
| 6 años | 0 | 0.0023 | 0 | 0.0248 |
Los resultados de la prueba de sensibilidad del modelo de Fourier construido, indicaron que se puede modelar velocidad del viento y temperatura ambiente para la ciudad de Cartagena y Barranquilla hasta 6 meses según el coeficiente de determinación de 0.93 con p-valor significativo de 0 (Tabla 3).

Con respecto a la temperatura se obtuvo un modelo de Fourier de temperatura para pronosticar cada 3 horas hasta 6 meses (Figura 7). El modelo fue validado con los datos de satélite ajustado, y se obtuvo un coeficiente de determinación de 0.93 con p-valor significativo de 0.

Las siluetas deben ser iguales o mayores a 0.6, si son menores, nos indica que los grupos no están correctamente diferenciados, por lo que según los resultados, es posible identificar dos grupos o clúster de asociación entre la temperatura ambiente y el viento para la ciudad de Barranquilla y Cartagena (Figura 8).

Con base en la agrupación no jerárquica de clúster (k-medias) vista en la Figura 9, se encontró que para la ciudad de Barranquilla se presentan dos patrones característicos del clima, siendo el primero presentando temperaturas de 25ºC y velocidad de viento de 3.5 m/s, y el segundo de 31ºC y velocidad de viento de 3.6 m/s, donde los rangos de viento y temperatura ambiente se encontraron entre 2.7 – 4.7 m/s y 20- 39ºC.
Los resultados de agrupación no jerárquica de clúster para la ciudad de Cartagena, evidenciaron dos patrones característicos del clima, donde el primer patrón indicó temperaturas de 26ºC y velocidad de viento de 2 m/s, y el segundo de 29ºC y velocidad de viento de 2.2 m/s, donde los rangos de viento y temperatura ambiente se encontraron entre 0 – 6 m/s y 20- 35ºC.
DISCUSIÓN.
La ventana de tiempo escogída para realizar el ACP fue de 3 días, ya que esta presentó un mejor ajuste de los datos y mayores coeficientes de correlación tanto para la temperatura como para la velocidad del viento de las ciudades de Barranquilla y Cartagena.
Para la temperatura de Barranquilla (Figura 3a) solo fue necesaria la inclusion de siete autovalores, y para la velocidad del viento en Cartagena cuatro (los cuales explicaron el 70 % de la variabilidad de sistema), la inclusión de mas componentes introduciria ruido en la predicción.
El ACP permitió replicar el comportamiento oscilatorio de la serie de tiempo, sin embargo la amplitud de la señal proyectados es mayor que la de la serie original, lo que indica que es necesario el uso de otra técnica en conjunto para lograr un mejor ajuste eg. Análisis de Fourier.
Con base en los análisis de Fourier, fue posible identificar patrones de variabilidad climática esperados, donde el ciclo diurno fue el de mayor densidad espectral para las dos ciudades y los dos parámetros. Las pruebas de sensibilidad, las cuales se efectuaron para conjunto de datos de tamaño de 1 y 6 años, se encontraron que a medida que aumenta el tamaño del lapso de tiempo, la técnica incrementa la identificación de los modos de oscilación natural. Para Barranquilla, el mejor modelo de viento mediante Fourier para la velocidad de viento y temperatura, requirió de 6 años del conjunto de información, con capacidad de pronosticar hasta de 6 meses. Con respecto a la ciudad de Cartagena, se requirió de un conjunto de datos de 6 años de duración, obteniéndose un modelo de Fourier con capacidad para modelar de manera trihoraria hasta 3 meses velocidad de viento, y 6 meses temperatura ambiente.
Los patrones de clima obtenidos mediante el análisis de clúster, permitieron identificar que para la ciudad de Barranquilla, la forma esférica de agrupación permite inferir que los datos se asocian a una distribución normal conjunta, tomando como las medias los valores de los centroides de cada clúster. Para la ciudad de Cartagena, el comportamiento de agrupación denotó que mayores velocidades de viento se presentan con respecto a Barranquilla principalmente cuando se registran 27ºC. Se encontró que las más bajas temperaturas tienen cierto grado de asociación con velocidad de viento inferior a 2 m/s donde se registraron valores de temperatura mínimos de 20ºC y atípicos alrededor de 10ºC.
5. CONCLUSIONES Y RECOMENDACIONES.
Las conclusiones extraídas de la presente investigación inicialmente se relacionan con el Análisis de Componentes Principales (ACP), en donde se encontraron dos tendencias. La primera tendencia muestra un nivel de representatividad alto en pocos componentes principales, y la segunda muestra un gran número de componentes con baja representatividad, lo que obliga a utilizar pocos para lograr una representatividad mayor al 70%. Adicionalmente, los modelos que tienen una baja representatividad no representan en forma adecuada los parámetros de temperatura y viento en su comportamiento y amplitud, por tanto, deberán ser ajustados para obtener un modelo adecuado. Lo anterior, vislumbra una debilidad en la técnica cuando se trata de obtener pronósticos con una ventana de tiempo grande.
Mediante el análisis de Fourier fue posible identificar patrones de variabilidad en diversas escalas, de las cuales se pueden mencionar la diaria, mensual, trimestral, semestral, anual, 2 años y 6 años, las cuales pueden estar asociadas a eventos climáticos locales y de orden regional como el Fenómeno del Niño. El modelo fue construido y validado con resultados estadísticos significativos los cuales permiten emplear el modelo de Fourier para pronosticar temperatura ambiente y velocidad de viento en las localidades de estudio hasta un lapso de tiempo de 6 meses. La técnica de clúster permitió identificar dos patrones climáticos en las localidades de estudio, donde a través del centroide de cada clúster fue posible identificar condiciones medias de temperatura y velocidad de viento.
A manera general fue posible emplear información de reanálisis, escalada espacialmente hasta las ciudades de Barranquilla y Cartagena, y validar el modelo mediante el empleo de información de estaciones climatológicas de resolución horaria. Mediante ajustes de regresión fue posible ajustar la información de Reanálisis, y mediante este se emplearon la técnica de componentes principales y Fourier para identificar los principales modos de oscilación de cada parámetro meteorológico. Con base en los modos de oscilación calculados mediante Fourier, se obtuvieron 4 modelos con pronósticos de resolución trihoraria y de alcance de 6 meses.
REFERENCIAS
Carvajal Y, Marco J. B. (2004). Análisis de Variabilidad de datos medioambientales aplicando Funciones Ortogonales Empíricas o componentes principales. Ingeniería de Recursos Naturales y del Ambiente, 1(2), 4-12.
IDEAM. (2016). Instituto de Hidrología, Meteorología y Estudios Ambientales. Recuperado el 05 de 02 de 2016, de http://www.ideam.gov.co
Kumar A, Sinha R, Bhattacherjee V, Verma D, Singh S. (2012). Modeling using K-means clustering algorithm. Recent Advances in Information Technology (RAIT), 1st International Conference
Kumar, V., Steinbach M, Tan P, Klooster S, Potter C, Torregrosa A. (2001). Mining scientific data: Discovery of patterns in the global climate system. . Joint Statistical Meeting
Miao C, Chen J, Liu J, Su H. (2015). An improved Markov chain model for hour-ahead wind speed prediction. Control Conference (CCC), 2015 34th Chinese.
Mo K, Ghil M. (1988). Cluster analysis of multiple planetary flow regimes. Journal of Geophysical Research: Atmospheres , 93, 10927-10952.
NOAA. (10 de 10 de 2015). Earth System Research Laboratory. Recuperado el 11 de 05 de 2016, de http://www.esrl.noaa.gov/psd/data/gridded/data.narr.html
Rojo-Hernández J. D, Carvajal-Serna L. F. (2010). Predicción no lineal de caudales utilizando variables macroclimáticas y análisis espectral singular. Tecnología y ciencias del agua, 1(4), 59-73.
Skapa J, Dvorsky M, Michalek L, Sebesta R, Blaha P. (2012). K-mean clustering and correlation analysis in recognition of weather impact on radio signal. Telecommunications and Signal Processing (TSP), 35th International conference.
Skittides C, Früh W. (2014). Wind forecasting using principal component analysis. Renewable Energy, 69, 365-374.