Resumen: Se aplicó un análisis de la calidad de los datos de precipitación mensual de 42 estaciones, en Centro Occidente de Venezuela. Se evaluó la consistencia de los datos, a través de pruebas de homogenidad, tales como el estadístico de Mann-Kendall (MK), el estadístico de Mann-Kendall correlacionado (MKC), el estadístico de Mann-Kendall estacional (SK), el estadístico de Mann-Kendall estacional correlacionado (CSK), la pendiente de Sen, la pendiente de estacional de Sen y cinco pruebas de homogeneidad de los datos. Se identificó un proceso de tendencia estacional no monótono bien localizado. Debido a que se determinó la existencia de un proceso de autocorrelación temporal, se concluye que los resultados obtenidos en el estadístico de MKC y CSK son los más acertados, en él 10 de las estaciones poseen tendencia estacional. Según la pendiente de Sen un grupo 8 estaciones poseen tendencia en toda la serie de tiempo. Los resultados de las pruebas de homogeneidad indican una presencia de un máximo de 11 estaciones con Change Point, sin embargo, no son comparables los test paramétricos de homogeniedad y sus versiones no paramétricas, debido a su diferente especificación, estas pruebas no son totalmente comparables.
Palabras clave:Homogeneidad de los datosHomogeneidad de los datos,TendenciaTendencia,Tendencia EstacionalTendencia Estacional,pruebas paramétricas y no paramétricaspruebas paramétricas y no paramétricas,precipitaciónprecipitación.
Abstract: An analysis of the quality of the monthly precipitation data of 42 stations was applied in the Western Center of Venezuela. The consistency of the data was evaluated through homogeneity tests, such as the Mann-Kendall statistic (MK), the correlated Mann-Kendall statistic (MKC), the seasonal Mann-Kendall statistic (SK), the Statistical seasonal correlated Mann-Kendall (CSK), the slope of Sen, the seasonal slope of Sen and five homogeneity tests of the data. A well-localized non-monotonous seasonal trend process was identified. Since the existence of a temporary autocorrelation process was determined, it is concluded that the results obtained in the MKC and CSK statistic are the most successful, in 10 of the seasons they have a seasonal tendency. According to the slope of Sen, a group of 8 stations have a tendency throughout the time series. The results of the homogeneity tests indicate the presence of a maximum of 11 stations with Change Point, however, parametric tests of homogeneity and their nonparametric versions are not comparable, since their statistical nature is totally different.
Keywords: Homogeneity of data, Trend, Seasonal Trend, parametric and non-parametric tests, precipitation.
Artículos
Análisis espacio temporal de la homogeneidad de estaciones de precipitación en una zona árida y semiárida del Centro Occidente de Venezuela
Spatio temporal analysis of the precipitation station’s homogenity in an arid and semi-arid zone of the Center West of Venezuela

Recepción: 18 Enero 2019
Aprobación: 14 Marzo 2019
El análisis de los datos climáticos para detectar cambios y tendencias es más fiable cuando se utilizan conjuntos de datos homogeneizados. En un conjunto de datos climáticos homogéneo todas las fluctuaciones contenidas en su serie temporal, reflejan la variabilidad y el cambio real del elemento climático representado. La mayoría de los métodos estadísticos parten de la hipótesis de que los datos que se están examinando están lo más exentos posible de errores debido a los instrumentos, la codificación, el proceso y otros errores no meteorológicos y no climáticos. Sin embargo, por lo general, los datos meteorológicos o climáticos ni son homogéneos ni están libres de errores (OMM 2011). La homogeneidad de una serie de datos climáticos puede definirse como la uniformidad de un parámetro medible, es decir, que su comportamiento sea casi el mismo a lo largo del tiempo (Zaid 2010).
Las causas más habituales de la no homogeneidad de una serie son: a) Mal estado o defectos de los instrumentos meteorológicos; b) Cambio de observador meteorológico, que se puede notar en las estimaciones en que intervienen elementos subjetivos; c) Cambio del tipo de instrumental y/o de sus condiciones de instalación, particularmente cuando se han cambiado de instrumental mecánico a digital; d) Cambio de los métodos de depuración de datos; e) Modificaciones eventuales del ambiente, estos cambios pueden ser: naturales (desarrollo de la vegetación) o artificiales (ligados a las actividades humanas) y e) Cambios climáticos o microclimáticos (Aguilar y col., 2003, Loup y col., 1963, Quintana 2001). La no homogeneidad de las series de observaciones es uno de los problemas más importantes teniendo en cuenta las consecuencias que implica usar series no homogéneas considerándolas como homogéneas (Aguilar y col., 2003). La comprensión profunda del comportamiento de la homogeneidad, las pruebas y su correcta aplicación al tiempo climático de una serie de tiempo tiene como objetivo serie preservar la estructura climática y eliminar o reducir la influencia de factores no climáticos (Toreti y col., 2001). La eliminación de falsos inhomogeneidades detectadas y la aceptación de las mismas en una serie afecta a cada análisis posterior (por ejemplo, tendencia evaluaciones, análisis extremos). Por lo tanto, es de gran importancia que los procedimientos de homogeneización sean cuidadosamente aplicados, por ello para realizar un análisis consistente de homogeneidad se debe disponer de los metadatos de las estaciones, en principio, como se mencionó anteriormente, las estaciones no homo géneas no se deben considerar en un análisis de variabilidad climática, ya que podría erróneamente interpretarse como evidencia de un cambio climático (Ablán y col., 2008).
Partiendo de estas ideas se plantean unas preguntas relevantes sobre la zona del Centro Occidente de Venezuela: a) Es posible que existan evidencias de alteraciones de tendencia y varianza en series de tiempo de precipitación mensual?, b) si estas fluctuaciones son ciertas es posible que sean causadas únicamente por efecto natural?, c) Es probable que estas fluctuaciones posean un patrón espacio temporal que sea identificable?
Se utilizaron 42 estaciones de precipitación mensual previamente seleccionadas ubicadas en la zona de los estados Trujillo, Lara, Yaracuy, Cojedes y Carabobo (figura 1), se utilizó el período comprendido entre el año 1949 al 2000 con una escala espacial de 1:70.000, en esta zona la distribución espacial de las estaciones se comporta de forma aleatoria, y la distribución temporal de los datos faltantes se aproxima a una distribución aleatoria, por lo que la medida de correlación derivada de ellos es espacio temporalmente balanceada (Andrades y col., 2018). Posteriormente, se realizó un examen visual de cada una de las series de tiempo de la estaciones de precipitación mensual, con el fin de identificar si existe un elemento anómalo sobre las series de tiempo de cada una de las estaciones.

Para determinar si las estaciones presentan tendencia o alteraciones de varianza, se aplicó el estadístico de Mann-Kendall (MK), esta es una prueba No Paramétrica, su desarrollo se define en tres pasos: 1) Se ordenan los valores de las variable, de forma ordenada x1, x2...xn; 2) Se obtiene el signo de la diferencia de cada par de valores al comparar sus magnitudes (xj ‒ xk) con j > k de acuerdo con lo siguiente: (xj ‒ xk) = 1, si (xj ‒ xk) > 0; 0, si (xj ‒ xk) = 0; ‒1, si (xj ‒ xk) < 0; 3) Obtención del estadístico S de Mann Kendall, mediante la ecuación:
; si S es positivo se infiere de forma subjetiva que la tendencia es creciente, cuando S es negativo se infiere que hay tendencia decreciente (Karmeshu 2012, Mondal y col., 2012, Castro y col., 2013, Cantor 2011, Kumar y col., 2017, Chu y col., 1997, Asfaw y col., 2017, Rustum y col., 2017). Éste se aplicó, tanto para toda la serie lo que indica la presencia de tendencia lineal o no lineal, y por cada mes individual (Castro y col., 2013), esto último es una prueba para detectar presencia de alteraciones de varianzas de forma lineal, siendo la hipótesis nula H0: No se presenta una tendencia en la precipitación y la alternativa H1: Hay una tendencia en la precipitación. Una crítica importante al indicador MK bajo la existencia de una autocorrelación positiva en los datos, incrementa la posibilidad de detectar tendencias cuando realmente no existen y viceversa (Cantor y col., 2011). Bajo autocorrelación serial el test MK hace que sea demasiado fácil afirmar una tendencia significativa cuando realmente la misma no está presente (Khaled y col., 1998), Butler 2015). Por ello, ante la posibilidad de que se esté bajo un proceso de correlación serial, se decidió realizar un test modificado del MK para datos con correlación serial y con corrección de la varianza (MKC) (Yue y col., 2004).
La prueba de tendencia de MK se utiliza para analizar los datos recopilados a lo largo del tiempo para aumentar o disminuir constantemente las tendencias (tendencias monotónicas) en los valores de una serie de tiempo. Ya que es una prueba no paramétrica, esto significa que funciona para todas las distribuciones (es decir, sus datos no tienen que cumplir el supuesto de normalidad), pero existen dos supuestos para que la prueba sea consistente (ausencia de correlación serial, ni poseer estacionalidad), cuando existe un proceso estacional se recomienda el uso del estadístico de Mann Kendall estacional (SK) (Khambhammettu 2005, Butler 2015). Por ello, también se aplicó la prueba no paramétrica Seasonal Mann-Kendall (SK), esta es una prueba global que identifica tendencia estacional para la temporada gth, ampliamente utilizada en datos hidroclimáticos, siendo la misma una versión multivariante de la prueba MK, el propósito de la prueba SK, es probar una tendencia monotónica de la variable de interés cuando se espera que los datos recopilados a lo largo del tiempo cambien en la misma dirección (hacia arriba o hacia abajo) durante una o más temporadas, por ejemplo, meses. Una tendencia ascendente (ó hacia decreciente) monótona significa que la variable aumenta (disminuye) constantemente a lo largo del tiempo, pero la tendencia puede ser lineal o no. La presencia de estacionalidad implica que los datos tienen diferentes distribuciones para diferentes estaciones (por ejemplo, meses) del año (Cantor 2011, Hirsch y col., 1982, Hirsch y col., 1984, Hipel y col., 1994, Pohlert 1996). Los siguientes supuestos subyacen a la prueba SK: 1) Cuando no hay una tendencia presente, las observaciones no se correlacionan en serie a lo largo del tiempo; 2) Las observaciones obtenidas a lo largo del tiempo son representativas de las condiciones reales en los momentos de muestreo; 3) Los métodos de recolección, manipulación y medición de muestras proporcionan observaciones imparciales y representativas de las poblaciones subyacentes a lo largo del tiempo; 4) Cualquier tendencia monótona presente está en la misma dirección (arriba o abajo). Si la tendencia aumenta en algunas temporadas y baja en otras temporadas, la prueba SK será engañosa y 5) La distribución normal estándar se puede usar para evaluar si la estadística de prueba de SK calculada indica la existencia de una tendencia monotónica a lo largo del tiempo, xij denota el dato obtenido para la temporada i en el año j, dónde una temporada puede ser un mes, semana, día, etc. Se define, por ejemplo, para unos datos mensuales X = (X1, X2, ..., X12) como el conjunto de datos completo recopilado durante años que consiste en subconjuntos de datos X1 a X12, donde: X1 = (x11, x12, ..., x1n1), es el subconjunto de datos de enero de n1 años, X1 = (x21, x22, ..., x2n2) es el subconjunto de datos de febrero para n2 años, n1 años, X12 = (x121, x122, ..., x12n12) es el subconjunto de datos de diciembre para n12 años, partiendo de ello, como el SK es una extensión multivariante del MK. Hay requisitos de que las mediciones se distribuyan normalmente o que cualquier tendencia monotónica, si está presente, sea lineal o no (Hipel y col., 1994). El SK se estima de la siguiente manera y se calcula como:
. Dónde Si es el número de diferencias positivas menos el número de diferencias negativas para el mes-enésimo. Si Si es un número positivo, las observaciones realizadas en los meses i en el año posterior tienden a ser más grandes que las realizadas en el mes i en años anteriores. Si Si es un número negativo, las observación realizada en el mes i en años posteriores tienden a ser más pequeñas que las realizadas en el mes i en años anteriores (Cantor 2011).
Las hipótesis planteadas con el estadístico de SK es que para cada . temporada las . observaciones son independientes e idénticas (sin tendencia monotónica), mientras que la hipótesis alternativa es que hay una tendencia monotónica durante una o más temporadas (Hipel y col., 1994). El estadístico SK, asume el supuesto de que no existe autocorrelación temporal en los datos. En caso de que este no se cumpla, se puede utilizar el estadístico de Mann-Kendall estacional correlacionado (CSK), ya que en la práctica, los datos ambientales generalmente están correlacionados y no distribuidos independientemente como se supuso anteriormente, es decir, bajo la prueba CSK el supuesto de que las estaciones de precipitación mensual presentan un proceso de autocorrelación temporal (correlación serial), es decir, el mes . está autocorrelacionado con los meses previos. Su estimador es:
. Dónde,
y
corresponde con el coeficiente de correlación de Spearman, para la estación g y h. Las hipótesis planteadas en el CSK son las mismas que las que se plantean en el test SK (Cantor 2011, Hirsch y col., 1982, Hipel y col., 1994, Pohlert 1996, Cantor y col., 2011).
Para establecer una magnitud de la pendiente, ya que la misma puede ser de tipo no lineal, se utilizaron los estadísticos de la pendiente de Sen y el estadístico de la pendiente estacional de Sen, el estadístico de la pendiente de Sen se calcula de la la siguiente manera:
. Para (1 ≤ i < j ≤ n), donde d es la pendiente, X denota la variable, n es el número de datos, e i, j son índices. La pendiente de Sen se calcula como la mediana de todas las pendientes: b = Mediandk. Las interceptaciones se calculan para cada paso de tiempo dado por: at = Xy ‒ b * t al igual que la pendiente de Sen la intersección correspondiente es también la mediana de todas las intersecciones. Para el caso de la pendiente el estadístico de la pendiente estacional de Sen, la pendiente estacional de Sen se calcula de la siguiente manera:
k, para cada uno (Xij, xij par i = 1, 2, ..., m, donde 1 ≤< j ≤ ni y ni es el número de valores conocidos en la i-ésima temporada. El estimador de la pendiente estacional es la mediana del dijk valores. Estos estadísticos han sido utilizados para la detección de tendencia y la descomposición de los ciclos en series de tiempo climáticas (Drápela y col., 2011, Hirsch y col., 1982, Pandit 2006, Pingale y col., 2006, Pohlert 1996).
Las pruebas de homogeneidad se utilizaron para detectar los denominados Changepoint o puntos de cambio, estas son variaciones abruptas en los datos de series de tiempo, tales cambios abruptos pueden representar transiciones que ocurren entre estados, éste tipo de análisis es útil en el modelado y la predicción de series de tiempo (Taylor 2000, Truong y col., 2018, Aminikhanghahi y col., 2017). Los test aplicados fueron sin estaciones de referencia, por lo que no se corrigieron ni descartaron estaciones (Ablán y col., 2008), la falta de metadatos de las estaciones hace que no se haga posible un análisis de este tipo. Cuando se realizan las pruebas de homogeneidad sin estación de referencia, los resultados de la detección de los denominados son menos confiables (Wang y col., 2013). Se ejecutaron dos conjuntos de pruebas homogeneidad de las series de tiempo, paramétricas y no paramétricas, se decidió aplicar ambas visiones, ya que las técnicas estadísticas no paramétricas ofrecen una menor cantidad de condiciones con respecto a las técnicas paramétricas, sin embargo, la ventaja de usar una prueba paramétrica en lugar de una no paramétrica consiste en que la primera tiene más potencia estadística que la segunda (Rojas 2003, Marín y col., 2015, XLSTAT 2017).
La prueba paramétrica utilizada consiste en una prueba T de Student modificada, para dar cuenta de la autocorrelación lag-1 en la detección de los cambios medios en series de tiempo de ruido Gaussiano blanco o rojo (autorregresivo de primer orden) usando la prueba máxima t penalizada o la prueba F máxima penalizada (PMF). Este enfoque empírico está integrado en un algoritmo de prueba gradual, por lo que los nuevos algoritmos pueden usarse para detectar puntos de cambio únicos o múltiples en una serie temporal (Wang(a) 2008, Wang(b) 2008, Wang y col., 2007). La prueba de detección de punto de cambio se basa en la máxima penalización de F-test (PMF), que permite que la serie de tiempo siendo probada pueda tener una tendencia lineal a lo largo de todo el período de registro de datos (Campozano y col., 2015).
Las pruebas de homogeneidad no paramétricas utilizadas, fueron como lo es las pruebas de Pettitt, Buishand Rank Test, Buishand U Test y el Standard Normal Homogeinity Test. La prueba de Pettitt plantea la hipótesis nula es que las variables T siguen una o más distribuciones que tienen el mismo parámetro de ubicación (sin cambios), frente a la alternativa: existe un punto de cambio. La prueba de Pettitt es un estadístico no paramétrico definido como KT = max|Ut, T |, dónde
el estadístico de prueba es
, en el caso de la prueba de Buishand Rank Test X denota una variante aleatoria normal, luego se puede proponer el siguiente modelo con un solo cambio (punto de cambio): xi = µ + ϵi, i = 1, ..., m; µ + ∆ + ϵi, i = m + 1, ..., n, bajo el supuesto de que ϵi sigue una distribución normal. La hipótesis nula ∆ = 0 se prueba frente a la alternativa ∆ ≠ 0 y el estadístico de prueba se estima Rb = ((maxSk ‒ minSk))/σ el p.valor se estima con una simulación Monte Carlo utilizando m réplicas. El estadístico de Buishand U o también conocido como Buishand U Test, plantea la misma hipótesis que la prueba de Buishand, descrita anteriormente, en este test el estadístico es: U = (n(n + 1))(−1)T Σ(k = 1)(n ‒ 1)(Sk/Dx)2 donde
, el valor Sk se estima con una simulación Monte Carlo utilizando m réplicas. Finalmente, se aplicó la prueba Standard Normal Homogeinity Test, en esta la hipótesis nula es la misma del test de Buishand. El estadístico se estima de la siguiente manera: Tk = kz12(n−k)kz12, (1 ≤ k < n); donde:
. El valor crítico es: T = maxTk el p.valor se estima con una simulación Monte Carlo utilizando m réplicas. Adicionalmente, como se desconoce si existe autocorrelación temporal se estimaron tres test de independencia, en estos la hipótesis nula es que la serie de tiempo es aleatoria, éstos test son el Wallis and Moore phase-frequency test, Bartels test for randomness y finalmente el Wald-Wolfowitz test for stationarity and Independence. Las pruebas de homogeneidad, son ampliamente utilizadas para datos climáticos (García 2017, Pingale y col, 2016). Se utilizaron las librerías R, Kendall, Trend, RHtestsV4, (McLeod 2015, Pohlert 1996, R Core Team 2019, Wang y col., 2010, Wang y col., 2013), adicionalmente, se utilizó un nivel de significancia 5 %.
Los resultados del análisis gráfico de la serie de tiempo indican la presencia de pocas alteraciones visuales en todas las series analizadas, un ejemplo se muestra en la en la figura 2. El estadístico de MK indica la presencia de tan solo 5 estaciones, 2 con tendencia a aumentar y 3 a disminuir, quedando 37 sin tendencia significativa. Las estaciones que tienen tendencia significativa se encuentran cercanas a zonas de alta producción agrícola, pero estos resultados deben tomarse con cautela ya que se rechazó para todas las estaciones la hipótesis nula de un proceso aleatorio e independiente (test de Wallis and Moore phase-frequency test, Bartels test for randomness y finalmente el Wald-Wolfowitz test for stationarity and Independence) por lo que se está ante un proceso de correlación serial que viola uno de los supuesto del test MK. Los resultados de la figura 3, muestran los resultados del test MKC se debe presumir que es uno de los más acertados a la realidad ya que presenta una corrección para la correlación serial, en él se presentan 13 estaciones con tendencia negativa (31 %), esto representa un aumento de casi el 24 % de las estaciones con tendencia negativa comparativamente con el estadístico MK, se agrupan en 3 conglomerados, uno al oeste del estado Lara (5 estaciones), un segundo grupo de (3 estaciones) en la zona norte del estado Trujillo y un grupo de tres estaciones entre los estados Yaracuy y Cojedes. Las estaciones con tendencia positiva son 10 (24 %), agrupados en dos conglomerados el mas grande en la zona central y norte del estado Lara y el oeste del estado Yaracuy y el segundo grupo en la zona de Trujillo.


Sin embargo, al aplicar el estadístico de MK mensualmente se encontró que casi todas las estaciones poseen tendencia para cada uno de los meses, siendo más frecuente en los meses secos y en el mes de septiembre la tendencia positiva, y siendo la tendencia negativa más frecuente en los meses de abril a junio y diciembre (figura 4), la interpretación de la prueba MK es engañosa, uno de los supuestos de esta prueba es que la es tendencia monótona (Hirsch y col., 1982). Otra crítica a estos resultados es que bajo la existencia de una autocorrelación positiva en los datos, incrementa la posibilidad de detectar tendencias cuando realmente no existen y viceversa, la existencia de autocorrelación positiva en los datos aumenta la probabilidad de detectar tendencias cuando en realidad no existen, y viceversa, aunque este es un hecho bien conocido, pocos estudios han abordado este tema, y la misma se ignora (Cantor y col., 2011, Hamed y col., 1998). Otra serie de problemas de las pruebas estadísticas de tendencia monotónica en series temporales estacionales se confunden comúnmente con algunos de los siguientes problemas: datos no normales, valores perdidos, estacionalidad, censura (límites de detección) y dependencia serial (Hirsch y col., 1982). En este sentido, es importante acotar que en una gran cantidad de estaciones de precipitación mensual la tendencia no es monótona a lo largo de los meses, por ello, los resultados obtenidos por el MK y el MKC pueden ser cuestionados desde varios puntos de vistas: 1) el MK por obviar la correlación serial es una prueba con intervalos de confianza muy estrictos y por ello no detecta la tendencia monótona; 2) el MKC posee intervalos de confianza demasiado holgados y con ello confunde cualquier cambio como tendencia monótona; 3) la tendencia realmente no es monótona y por ello las pruebas MK y MKC son contradictorias y finalmente, 4) una combinación de todas las anteriores. Para responder a estas interrogantes sobre la estructura de la tendencia uno de los procedimientos más factible y sencillos es la estimación de modelos de series de tiempo lineales de tipo ARMA (p, d, q)(P, D, Q)E, ajustados bajo el uso de la metodología de Box y Jenkins si en el modelo se estima de forma correcta un parámetro d 1 quiere decir que los datos poseen tendencia monótona lineal, en caso contrario, la misma o no es monótona y/o no es lineal (Box y col., 2015, Cryer y col., 2008).

Desde un punto de vista de frecuencia espacial es más común encontrar tendencia significativa positiva del centro al oeste del estado Lara y los estados Yaracuy, Cojedes y Carabobo; y negativa del centro al oeste del estado Lara y algunas zonas del Norte del Estado Trujillo. Estos resultados son corroborados cuando se realizó el gráfico de distribución de frecuencia de la tendencia (Positiva, Negativa y Total), donde se encontró cómo se divide en dos zonas, Tendencia Positiva al este y Tendencia Negativa al oeste. Estos resultados son indicativos de la presencia de un mecanismo de tendencia estacional que genera una alteración de varianzas en la precipitación mensual. Otro elemento importante es la presencia de tendencia positiva en los meses de febrero, marzo y septiembre, en dirección centro oriental del área de estudio, y en mayo, junio y diciembre se presenta tendencia negativa al centro occidente y suroeste del área de trabajo. Un elemento importante de estos resultados es que el estadístico de MK aplicado por mes, indica la posibilidad real y sustantiva de la presencia de un mecanismo de volatilidad de la varianza, en consecuencia, los modelos de series de tiempo tradicionales que suponen varianza homocedástica, no son adecuados para modelar este tipo de datos.
El estadístico de SK, indica que 12 estaciones (28.57 %) presentan tendencia estacional, de esas doce estaciones, según los resultados del estadístico de la Pendiente de Sen Estacional tres estaciones presentan tendencia estacional positiva, una se ubica en el centro del Estado Lara y dos ubicadas en el sur del Estado Trujillo; 7 estaciones presentan tendencia estacional negativa, 4 ubicadas en el centro del Estado Trujillo, una en Lara y una en el estado Cojedes y finalmente dos estaciones catalogadas como indefinidas Carache en el estado Trujillo y Cubiro en el Estado Lara, ya que aunque el estadístico de SK es significativo la Pendiente de Sen Estacional es igual a cero, esto puede ser causado a que los meses de dichas estaciones poseen comportamientos que no son uniformes ni monótonos (meses con tendencia estacional positiva y otros con tendencia estacional negativa), por lo que no se consigue un claro dominador en el estimador de la Pendiente de Sen Estacional (figura 5a), estos resultados tienen relación con los obtenidos por el estadístico de MK por mes individual (Castro y col., 2013). En la figura 5b presentan los resultados del estadístico de CSK, en este caso 10 estaciones presentan tendencia estacional, una indefinida en el estado Carabobo, en la cual se asume el mismo comportamiento explicado anteriormente para estos casos, en el estado Lara 6 con tendencia negativa, una en el estado Yaracuy, una en el estado Trujillo y otra en el estado Cojedes.
Un análisis necesario es el de comparar el comportamiento según los resultados de los estadísticos SK y de Pendiente de Sen Estacional con los obtenidos por CSK y de Pendiente de Sen Estacional, en este sentido 26 estaciones de precipitación mensual coinciden en los resultados obtenidos, siendo dos estaciones con tendencia estacional negativa, la estación Tinaquillo (2316) en el estado Cojedes y la estación Carora-Granja (1189) en el estado Lara, una estación con tendencia estacional positiva, la Mesa de Esjunaque (2193) en el estado Trujillo, las restantes 23 estaciones no tienen tendencia estacional significativa, restando 16 estaciones en los cuales no coinciden los resultados entre ambos análisis; la estación Valencia-GCF (461) ubicada en el estado Carabobo, que bajo el estadístico de SK es caracterizada como no significativa y bajo el estadístico de CSK se define como una estacón con tendencia indefinida. Seis estaciones en el estado Lara, dos (Quebrada Arriba y Trentino-La Pastora) que son catalogadas por el estadístico de Mann-Kendall estacional como no significativa y bajo el CSK como con tendencia estacional negativa, una estación (Duaca) caracterizada con tendencia estacional no significativa según el estadístico de SK y con tendencia estacional positiva según en el estadístico de CSK. Las estaciones Bobare, Quibor y Cubiro, que fueron caracterizadas por el SK como procesos con tendencia estacional positiva, negativa e indefinida respectivamente.
En el estado Trujillo siete estaciones poseen diferencias entre la caracterización de ambos estadísticos, que desglosan de la siguiente manera: 4 estaciones, Valle Hondo, Cenizo-Campamento Vivian, Sabana Grande y Las Cruces, que según el estadístico de SK poseen tendencia estacional negativa y que según el CSK del mismo poseen tendencia no significativa, las estaciones Carache, Santiago de Trujillo y Jajo, fueron caracterizadas según el estadístico de SK como indefinida, positiva y no significativa respectivamente y según el CSK del mismo estadístico las estaciones Carache y Santiago de Trujillo poseen tendencia no significativa mientras que la estación Jajo posee tendencia negativa. Finalmente, el estado Yaracuy posee dos estaciones que tuvieron cambios en su interpretación, estas son Taria y Urachiche, que pasaron de poseer tendencia estacional no significativa a poseer tendencia negativa y positiva respectivamente, según el estadístico de CSK.
Bajo estos resultados cabe preguntarse cuál de los estadísticos es el que más se aproxima a la realidad, en este sentido es relevante destacar que se según los test de Wallis and Moore phase-frequency test, Bartels test for randomness y finalmente el Wald-Wolfowitz test for stationarity and Independence, en el 100 % de las estaciones se rechazó la hipótesis nula de independencia entre las observaciones, por lo se está en presencia de un proceso de autocorrelación temporal no estacionario, según esto el estadístico de Mann-Kendall estacional autocorrelacionado (CSK) debe ser el más aproximado a la realidad.
Los tres requisitos fundamentales para aplicar técnicas paramétricas de series de tiempo, los tres requisitos básicos de los métodos de estadística paramétrica clásica son: i) normalidad, los residuos del modelo deben seguir una distribución normal, ii) homocedasticidad, la varianza de los residuos debe ser constante y no variar entre los distintos niveles del factor analizado, y iii) independencia, las observaciones deben ser independientes entre sí. La autocorrelación se puede definir como la correlación entre miembros de series de observaciones ordenadas en el tiempo (Escalante y col., 2010). Cuando existe autocorrelación, la matriz de varianzas/covarianzas de las perturbaciones de un modelo contiene elementos no nulos que hace ineficiente al modelo (de Arce y col., 2017).

Al analizar los resultados de la Pendiente de Sen, se observa que 36 estaciones no poseen tendencia significativa, cinco estaciones con tendencia negativa tres ubicadas en el estado Lara (Quebrada Arriba, Carora-Granja y Trentino-La Pastora), una en el estado Trujillo (Jajo) y otra en el estado Yaracuy (Taria). Tres estaciones de precipitación mensual con tendencia positiva dos en el estado Lara (Duaca y Canape) y una en Yaracuy (Urachiche). Si la tendencia es lineal, en la estimación de un modelo de series de tiempo paramétrico debería manifestar el efecto de la tendencia (Cryer y col., 2008), si no se manifiesta en las estaciones es posible que la misma sea de tipo no lineal y/o que el falten parámetros por estimar.
El número de estaciones de precipitación mensual por estado con Changepoint identificados, la prueba F máxima penalizada (PMF) (Wang(a) 2008, Wang(b) 2008, Wang y col., 2007), es el proceso que caracterizó mayor cantidad de Changepoint (11), más frecuentes, en los años 50 y 80, ubicados en dirección este-oeste; seguido por el Buishand Rank Test (9), el Standard Normal Homogeinity Test (8), Buishand Rank Test (6) y finalmente el Pettitt Test (5). (Martínez y col., 2010, Rustum y col., 2017), afirman que Standard Normal Homogeinity Test detecta roturas más fácilmente al principio y al final de las series de tiempo, mientras que el Buishand Rank Test, y Buishand U Test el Pettitt las pruebas son más sensibles a los descansos ubicados en el medio de las series. En este orden de ideas la prueba pruebas de homogeneidad F máxima penalizada (PMF) desarrollada por (Wang(a) 2008, Wang(b) 2008, Wang y col., 2007), en ella se propone un enfoque empírico, el cual consiste un una prueba T de Student modificada, para dar cuenta de la autocorrelación lag-1 en la detección de los cambios medios en series de tiempo de ruido Gaussiano blanco o rojo (autorregresivo de primer orden), en esta prueba se evalúa la hipótesis nula de que la media de la población estudiada es igual a un valor especificado
, dónde es la media muestral, µ0 es un tamaño especificado, s es la desviación estándar muestral y n es el tamaño de la muestra la prueba de máxima penalización de F-test (PMF), que permite que la serie de tiempo siendo probada pueda tener una tendencia lineal a lo largo de todo el período de registro de datos (Campozano y col., 2015).
Con ello, es evidente que los Changepoint detectados por los test Pettitt Test, Buishand Rank Test, Buishand U Test, Standard Normal Homogeinity Test se complementan entre si ya que como se mencionó anteriormente el Standard Normal Homogeinity Test detecta roturas más fácilmente al principio y al final de las series de tiempo, mientras que el Buishand Rank Test, y Buishand U Test el Pettitt las pruebas son más sensibles a los descansos ubicados en el medio de las series.
Sin embargo, es importante la diferencia en el número de estaciones Pettitt Test, Buishand Rank Test, Buishand U Test, Standard Normal Homogeinity Test contra la prueba F máxima penalizada (PMF), las pruebas paramétricas asumen distribuciones estadísticas subyacentes a los datos, por tanto, deben cumplirse algunas condiciones de validez, de modo que el resultado de la prueba paramétrica sea fiable, en cambio las pruebas no paramétricas no deben ajustarse a ninguna distribución. Las técnicas estadísticas no paramétricas ofrecen menor rigidez con respecto a sus condiciones que las técnicas paramétricas, aunque sacrificando para ello su potencia de explicación. Pueden por tanto aplicarse incluso aunque no se cumplan las condiciones de validez paramétricas, en este sentido, las pruebas no paramétricas son más robustas que las paramétricas ya exigen menos condiciones de validez, sin embargo, la ventaja de usar una prueba paramétrica en lugar de una no paramétrica consiste en que la primera tiene más potencia estadística que la segunda (tienen mayor capacidad de conducir a un rechazo de la hipótesis nula) (Rojas 2003, Marín y col., 2015, XLSTAT 2017). Por ello, no son comparables ambos grupos de test, pero si son es complementarios entre si, ya que las pruebas no paramétricas son más flexibles ante las diversas situaciones que se presentan como lo es la distribución no normal de los datos de precipitación. Pero se requieren de intervalos de confianza angostos y restrictivo que favorezcan el rechazo de la hipótesis nula. Es por las diferencias anteriormente descritas, que la prueba F máxima penalizada (PMF) posee una mayor cantidad de estaciones con Changepoint.
En otro orden de ideas, ya que se detectaron Changepoint en las estaciones de precipitación mensual es posible que se esté en presencia de un espacio de estado en cada una de las series de tiempo, formalmente, un espacio de estado es un proceso lineal dinámico en donde los valores del estado en el tiempo t están representados por una columna de matriz θt y son una combinación lineal de los valores del estado en el tiempo t ‒ 1 y variación aleatoria (ruido del sistema) en un proceso multivariado con distribución normal (Vargas 1999, Metcalfe y col., 2009, Cryer y col., 2008).

Los resultados de las pruebas estadísticas indican la presencia real y sustantiva de un proceso de alteración de las varianzas con un arreglo bien diferenciado, esto determinado por el estadístico de MK por mes ya que con él se concluye que no existe un proceso de tendencia monótona; existen otras opciones para evaluar el proceso de alteración de la varianza, tal como lo son los tests sugeridos por (Hirsch y col., 1982, Hipel y col., 1994) para el análisis de la tendencia estacional, así como las técnicas no lineales de análisis espectral y regresión armónica en presencia de autocorrelación, como lo son las planteadas por (Neeti y col., 2011, Rustum y col., 2009).
En principio los resultados que obtenidos por los test MCK y CSK para cada una de las estaciones pueden asumirse como los más acertados, debido a la presencia de correlación serial y estacionalidad en las series de tiempo, presentando una gran cantidad de estaciones con tendencia estacional no significativa, luego tendencia estacional negativa y positiva, sin embargo, estos resultados deben tomarse con cautela, ya que al encontrarse un proceso no monótono que indica el MK por mes, no exime de que los meses de cada una de las estaciones no posean tendencia de manera individual, si no que el proceso dominante de tendencia estacional es más frecuente de ese tipo, pese a estos resultados el CSK presenta una gran cantidad de limitaciones documentadas y por ello los mismos no conllevan a una conclusión fuerte y generalizada. El proceso de tendencia no monótona en cada una de las 42 series de tiempo puede estarse ante un proceso tendencia no lineal y/o ciclos, adicionalmente, con la detección de los Changepoint y el proceso de Tendencia estacional, en las estaciones de precipitación mensual es posible que se esté en presencia de un espacio de estado en las series de tiempo. El ajuste de modelos ARMA de series de tiempo y su posterior diagnóstico de los residuales, podrían en principio discernir sobre dicha pregunta. Como se mencionó anteriormente no son comparables test paramétricos y no paramétricos, pero si son es complementarios entre sí, ya que las pruebas no paramétricas son más flexibles ante las diversas situaciones de estadística inferencial.
Debido a la posibilidad real y sustantiva de la presencia de un Mecanismo No Aleatorio Espacio Temporal de los datos faltantes es preferible realizar estos análisis de homogenidad previamente y a la imputación de los datos y posterior a este proceso, como se hizo en este caso, ya que es posible que éste proceso origine un cambio en la respuesta de las pruebas de homogeneidad aplicada.
koflasjesus@gmail.com





