Resumen:
La no disponibilidad de información desagregada geográficamente impide obtener evidencia empírica con el fin de responder a algunas preguntas re- levantes en el campo de la economía urbana y regional. El objetivo de este trabajo es calcular el Producto Interno Bruto (PIB) para los 42 municipios del Departa- mento del Valle del Cauca - Colombia, año 2010, utilizando técnicas de inferencia ecológica basada en los modelos de entropía, los cuales ya han sido aplicados para España y México con resultados satisfactorios. El método propuesto y la aplicación de inferencia ecológica permite obtener el PIB para los 42 municipios desagregado a 11 sectores económicos, un trabajo pionero y de suma utilidad en la región.
Palabras clave:economía regional y urbanaeconomía regional y urbana,inferencia ecológicainferencia ecológica,modelos de entropíamodelos de entropía,Producto Interno BrutoProducto Interno Bruto,análisis de datosanálisis de datos.
Abstract:
The unavailability of geographically disaggregated information does not allow obtaining empirical evidence in order to answer some important questions in the field of urban and regional economics. The objective of this work is to calculate the Gross Domestic Product (GDP) at local level, for the 42 mu- nicipalities of Valle del Cauca - Colombia in 2010, using ecological inference techniques based on entropy models that have already been applied in Spain and Mexico with satisfactory results. The proposed method and the application of ecological inference allows of the GDP disaggregated by the 11 economic sectors, a pioneering and very useful work in the region.
Keywords: regional and urban economics, ecological inference, entropy models, Gross Domestic Product, data analysis.
Métodos de entropía cruzada generalizada: una aproximación a la medición del Producto Interno Bruto para los municipios del Valle del Cauca - Colombia *
Cross Entropy Generalized: an approach to the measurement of GDP for the municipalities of Valle del Cauca (Colombia)

Recepción: 18 Enero 2016
Aprobación: 11 Julio 2016
Durante las últimas décadas la Economía Aplicada, específicamente la Economía Urbana y Regional, ha ido conformando un cuerpo de teorías que dan una visión general del papel de las ciudades en el desarrollo de los territorios. Su tamaño y la distancia entre ellas, determinan su importancia, la jerarquía y hasta la estructura económica, razón por la cual surgen los conceptos y teorías de economías externas de urbanización, economías de localización y economías de escala, entre otros. Estos conceptos, ampliamente discutidos y explorados en la literatura, ayudan a comprender cómo las ciudades influyen en la competitividad, productividad y capacidad innovadora de las empresas y, a su vez, en el crecimiento de regiones o países. Las regiones, sin embargo, reciben un concepto distinto al que la sociedad tiene de ellas, el principal elemento diferenciador del concepto de región es el de su apertura eco- nómica (Polése, 1998: 30).
En muchas ocasiones, en los países y principalmente en las regiones la información estadística disponible es limitada y no permite trabajar con unidades de análisis local que posibiliten un estudio y comparación de la evolución y crecimiento de las distintas ciudades que componen un territorio amplio. Colombia es un buen ejemplo de ello. La información estadística nacional es producida por el Departamento Administrativo Nacional de Estadísticas (DANE), quien muchas veces con el apoyo del Banco de la República y el Departamento Nacional de Planeación (DNP) emiten cifras sobre población, producción, Índice de Precios al Consumidor (IPC), mercado laboral, entre otras. No obstante, mucha de esta información está desagregada solo hasta un nivel departamental 1 y, en ocasiones, disponible para las ciudades capitales. En otras palabras, no existen datos que permitan identificar y analizar el comporta- miento y la evolución de aspectos socioeconómicos en la totalidad de los municipios.
Algunos esfuerzos atinentes a este vacío de información son realizados por Meisel y Bonet (1999), Galvis y Meisel (2000), y Galvis y Hahn (2015); quienes ofrecen metodologías para calcular el PIB municipal para Colombia a través de variables proxys como depósitos bancarios per cápita reales o estimaciones a través de ejecuciones presupuestales de cada municipio, que sirven de insumo para sus investigaciones sobre crecimiento y convergencia.
Esta investigación tiene como propósito calcular el PIB para los municipios del Valle del Cauca desagregado a 11 sectores económicos 2, utilizando métodos indirectos como son los modelos de entropía: entropía cruzada y entropía cruzada generalizada. Con lo cual además de contar con un agregado de suma importancia a nivel municipal, se podrán diseñar medidas de política económica tendentes a generar crecimiento en el municipio y el departamento.
En concordancia con el objetivo y debido a la ausencia de datos que midan la producción a nivel municipal, este trabajo se enmarca en utilizar un método homogéneo para estimar datos del PIB a escala local, como son los modelos de entropía. En muchos campos de investigación se requiere de información particular, individual o desagregada y, dadas las limitaciones de disponer de bases de datos con altos niveles de desagregación, mediante enfoques propios del análisis estadístico, cada vez es más frecuente recurrir a estimaciones. La Inferencia Ecológica (IE, en adelante) es el proceso a través del cual se extraen las características individuales desde información que se encuentra contenida en un conjunto de datos agregados. En general, la información inicial consiste en obtener medias o totales de la variable de interés; por ejemplo, por grandes áreas geográficas.
El artículo se compone de cinco secciones incluyendo esta introducción. En la segunda sección se encuentra el marco teórico. En la tercera se explican la metodología y el procedimiento de estimación. La cuarta sección contiene el análisis de los resultados y en la quinta están las conclusiones.
Una limitación frecuente para la economía empírica es la falta de datos disponibles en escalas espaciales con alto nivel de desagregación. Aunque el objetivo, en principio, es trabajar en una escala geográfica más pequeña, la no disponibilidad de información desagregada geográficamente por lo general limita las conclusiones del análisis a nivel agregado. Para superar este problema, se puede aplicar un proceso de Inferencia Ecológica (IE) con el fin de recuperar la información en la escala espacial requerida 3.
En términos generales, la IE es el proceso de estimación de información desagregada de los datos reportados a nivel agregado. La investigación en este área ha avanzado mucho en los últimos años gracias a su utilidad en gran cantidad de disciplinas académicas de las ciencias sociales, así como en el análisis de políticas. Los fundamentos de la IE se introdujeron en los trabajos iniciales de Duncan y Davis (1953) y Goodman (1953), cuyas técnicas fueron las más destacadas durante más de cuarenta años. Sin embargo, el trabajo de King (1997) supone un desarrollo sustancial con la propuesta de una metodología que reconcilia y amplía los enfoques adoptados previamente. Un extenso estudio de las contribuciones recientes al campo de la IE se encuentra en King et al. (2004).
El problema de la estimación de datos espacialmente desagregados puede ser descrito en los mismos términos que en el problema de la matriz de equilibrio representada en Golán (2008: 105), donde el objetivo es llenar las celdas (desconocidas) de una matriz utilizando la información que está contenida en los datos agregados de la suma de la fila y la columna. Gráficamente, el punto de partida de nuestro problema es una matriz donde las celdas son elementos desconocidos que nos gustaría estimar, para lo cual se definen las siguientes sumas:
(1)
(2)
(3)Los elementos Zij se pueden expresar como una distribución de probabilidad bidimensional dividiendo las cantidades de cada una de las celdas de la matriz por la suma
. En tal caso, la matriz anterior puede reescribirse en términos deuna nueva matriz P donde los se pij definen como las proporciones
, con nuevas filas y columnas marginales definidas como
, respectivamente. Enconsecuencia, las siguientes igualdades son cumplidas por los elementos pij:
(4)
(5)Estos dos conjuntos de ecuaciones reflejan todo lo que sabemos acerca de los elementos de la matriz P. La ecuación (4) muestra la relación cruzada entre los pij (desconocidos) de la matriz y de las sumas (conocidas) de cada fila y columna. Adicionalmente, la ecuación (5) indica que la sumatoria de los elementos pij pueden ser vistos como la verificación de que la suma de las probabilidades (columna) sean igual a uno. En este contexto el principio de Entropía Cruzada (EC) puede ser aplicada para recuperar las probabilidades desconocidas pij si tenemos a disposición una distribución a priori Q que refleja nuestros supuestos iniciales sobre las celdas desconocidas de la matriz P. En otras palabras, se quiere transformar una matriz a priori de probabilidad Q en una matriz posterior P que es consistente con los vectores R y C.
La solución a este tipo de problemas se obtiene minimizando una medida de divergencia con la probabilidad previa de la matriz Q sujeto al conjunto de restricciones (4) y (5), que puede ser escrita en los siguientes términos:
(6)La medida de divergencia D (P < Q) es la entropía de divergencia de Kullback- Liebler, entre las distribuciones posteriores y anteriores 4. Las técnicas de estimación basadas en entropía pueden ser aplicadas directamente al campo de la IE. Al respecto, Judge et al. (2004) sugirieron el uso de técnicas de estimación basados en la informa- ción para los problemas de IE, aunque en un contexto diferente.
En este trabajo se propone la aplicación de EC siguiendo los lineamientos de Judge et al. (2004) y que presenta la IE como un caso particular del problema más general de equilibrio de la matriz, con el objeto de estimar el PIB para los 42 municipios del departamento del Valle del Cauca, desagregado a 11 sectores económicos.
El procedimiento anteriormente esbozado asume que se tiene información perfectamente fiable de los márgenes de R y C, lo cual es una suposición poco realista. Supongamos ahora que observamos fila y columnas marginales como R y C, donde:
(7)
(8)Donde fi y fj y son errores aleatorios que hacen que los márgenes observados difieran de los márgenes reales de la matriz de destino. En esta situación es todavía posible ajustar Q con filas y columnas marginales no perfectamente fiables, por medio de un enfoque de Entropía Cruzada Generalizada (ECG), siguiendo un enfoque similar al de las ideas sugeridas en Golán y Vogel (2000) y Robinson et al. (2001) [tomado de Fernández y Garduño (2012)].
La idea básica consiste en volver a parametrizar los errores fi y fj en términos de distribuciones de probabilidad desconocidas. La incertidumbre acerca de las realizaciones de estos errores se introduce en el problema al considerar cada elemento fi y fj como variables aleatorias discretas con L $ 2 resultados posibles (en aras de la simplicidad L se supone común para ambos). Estos valores se encuentran en dos conjuntos convexos v' = {v1, ..., 0, ... , vL} y u' = {u1, ... , 0, ... , uL} , respectivamente. También se supone que estas realizaciones posibles son simétricas (- v1 = vL; - u1 = uL) y se centraron en cero. Las distribuciones de probabilidad desconocidas para los vectores de soporte se denotan como wf y we y, consecuenteme te, los errores aleatorios se definen como:
(9)
(10)En consecuencia, el problema de la ECG se puede escribir en los siguientes términos:
(11a)Sujeto a:
(11b)
(11c)
(11d)
(11e)Ambos límites especificados en los vectores de soporte, así como las distribuciones de probabilidad a priori (w 0 y w 0 ) reflejan nuestros supuestos sobre la forma en que los errores están afectando a los márgenes observados. Límites más grandes en v y u permitirían, por supuesto, errores más grandes. En el contexto de los problemas de la ECG, los valores de los vectores de soporte para los errores suelen ser fijos después de la regla de los tres sigma (Pukelsheim, 1994), que en este caso implica tomar como límite superior e inferior más o menos tres veces la desviación estándar de R y C, respectivamente, mientras que las distribuciones a priori ( w 0 y w 0 ) se establecen como uniforme.
El método de EC requiere información agregada a nivel municipal y por sectores económicos, para lo cual los datos agregados de la suma de fila y columna que se tienen en cuenta para el cálculo del PIB de los municipios del Valle del Cauca son en su orden:
Se utiliza como sumatorio total de fila el Valor Agregado (VA) municipal para el año 2010 en miles de millones de pesos5.
Por otro lado se utiliza como sumatorio total de columna la Matriz Insumo Producto (MIP) simétrica del Valle del Cauca (2005) en miles de pesos constantes de 2005 6, agregada a 11 sectores económicos. El Valor Bruto de la Producción VBP y el PIB se inflactan mediante deflactores implícitos para tener los agregados al año 2010.
Como ya se ha explicado, el punto de partida de nuestro problema es una matriz donde las celdas son elementos desconocidos que se desean estimar. Para el caso del Valle del Cauca no se cuenta con variables que cumplan las condiciones de ser municipalizadas y al mismo tiempo por sectores económicos; lo que origina un problema del que hasta el momento no se tiene conocimiento en la literatura, al momento de hallar y estimar la matriz . Con el fin de resolverlo, se decide construir la matriz , a partir de un conjunto de vectores, uno para cada grupo de productos, con el fin de disponer de información municipal. Las variables utilizadas se muestran en el Cuadro 17.


Después de contar con la información de la matriz inicial de distribución (42*11), que se obtiene de cada uno de los vectores por sector económico relacionados previamente, se procede a transformar la matriz Q (42*11) en términos de coeficientes técnicos de la participación de cada uno de los municipios en el total de cada uno de los sectores económicos. Con esto, la matriz Q queda lista para ser incluida en el modelo junto con los vectores R y C. El vector R de dimensión (42*1), está formado por el VA municipal, el vector C de dimensión (1*11), son los 11 sectores económicos para los cuales se calcula el PIB municipal tomados de la matriz insumo producto. A partir de estos datos agregados se aplica una estimación de entropía para calcular el PIB para los municipios del Valle del Cauca, como se explica en el marco teórico. De acuerdo con estos criterios, y para el desarrollo del ejercicio, se plantea inicialmente el siguiente problema de EC como lo explican las siguientes ecuaciones:
Sujeto a:
(13)
(14)El método de ajuste anteriormente esbozado asume que se tiene información perfectamente observable en los márgenes de C y R, lo cual es una suposición poco realista. Considerando el supuesto que el vector C podría ser observable sin error (MIP Valle del Cauca), es difícil asumir que se tiene información perfectamente confiable en R, teniendo en cuenta que dicha información (VA por municipios) se estima de aproximaciones metodológicas de las Cuentas Departamentales. En este contexto la información de los vectores C y R queda definida de la siguiente manera
por consiguiente la situación de EC es convertida en un problemade ECG como el siguiente:
(15)Sujeto a:
(16)
(17)
(18)El último término de la ecuación (11a) se elimina en las ecuaciones (15), y (16) es idéntica a (14), ya que se supone que C se observa sin error. En aras de la simplicidad, solo tres puntos (L = 3) se incluyen en los vectores de soporte de los errores en R, que han sido fijados utilizando la regla de tres sigma y siempre el punto central igual a cero 8. Para más claridad, es necesario decir que ambos límites especificados en los vectores de soporte, así como las distribuciones de probabilidad a priori (w 0 y w 0) reflejan nuestros supuestos sobre la forma en que los errores están afectando a los márgenes observados 9.
A pesar que la importancia de este documento radica en mostrar a la EC como herramienta para la medición económica y especialmente en el ámbito de información restringida, a continuación se realiza un análisis de los resultados encontrados para el Valle del Cauca en el año 2010 10.
El Valle del Cauca se encuentra situado al sur occidente del país, entre la Cordillera Occidental y la Cordillera Central de los Andes, en el valle geográfico del río Cauca de donde proviene su nombre, es el tercer departamento en importancia económica de Colombia, ya que aporta alrededor del 10% del PIB nacional. Cuenta con una población de 4.383.277 para el año 2010 según proyecciones del departamento nacional de estadísticas (DANE) y está dividido en 42 municipios como se muestra en la Figura 1.

El Cuadro 2 y la Figura 2 muestran la distribución del PIB del Valle del Cauca, ordenados por importancia relativa de mayor a menor y la participación acumulada. Como se puede observar Cali (su capital) aporta el 48,6% del PIB departamental, con un total de 20,2 billones de pesos. Le siguen en importancia los municipios de Yumbo y Palmira (ciudades intermedias) que registran PIB superior a los 3.000 millones de pesos, aportando el 8,3% y 7,6% al PIB departamental, respectivamente. Por su parte, Buenaventura, Tuluá, Buga y Cartago quienes también son ciudades intermedias registran un PIB superior a los 1.000 millones de pesos, aportando al PIB departamental 5,5%, 4,7%, 3,7% y 2,9%, respectivamente.
Los municipios de Candelaria, Jamundí, El Cerrito, Zarzal, Bugalagrande, Florida y Pradera aportan al PIB entre 0,9% y 2,4% y el resto de municipios (28), tienen aporte al PIB inferior a 0,9%. De estos 28 municipios, once se ubican en el norte del departamento. Como se puede observar, algo más del 20% de los municipios generan alrededor del 80% del PIB departamental.
Los municipios que son considerados como principales son: Cali en primer lugar, le siguen en importancia Palmira, Yumbo y Buenaventura y posterior en aporte al PIB se encuentran los municipios de Tuluá, Buga, Jamundí y Candelaria, los dos últimos con una importante relación económica con la capital del departamento al pertenecer a lo que se considera el área metropolitana de Cali y Buenaventura por ser la ciudad con el puerto en el océano pacífico.



La importancia de la medición del PIB a nivel municipal cobra mayor representatividad en la región al poder desagregarla a nivel de 11 sectores económicos, lo cual proporciona herramientas importantes a cada uno de los municipios al momento de identificar sus sectores potenciales y la representatividad de su producción. A nivel de los 42 municipios y de los 11 sectores económicos en que se ha calculado el PIB destacan: Agrícola (5%), Pecuario (3%), Industria (28%), los Servicios Financieros e inmobiliarios (22%) y los Servicios de mercado (10%) y los de no mercado (4%). Con el fin de no excluir el resto de sectores y de resumir los resultados se realizan agregaciones de cada uno los grandes sectores y se calcula el PIB para los sectores primario, secundario y servicios.
El sector primario se encuentra conformado por los subsectores Agrícola (5%), Pecuario (3%) y Minería (0,2%), dentro del cual el municipio de Palmira aporta el 10,6% del total del sector primario y por desagregación del grupo de producto este municipio reporta un 14,5% agrícola, 5,3% pecuario y no registra minería. Por su Cali, contribuye en un 11,7% del sector primario los cuales son aportados por los sectores agrícola 2%, pecuario 27,3% y minería 8%.
La participación de la minería en el departamento es solo del 0,2% y se registra actividad minera en los municipios de Buenaventura, Jamundí, Cali y Ginebra. Por su parte, los municipios de Candelaria y Buga aportan al PIB del sector primario el 9,3% y 8,6% respectivamente, seguidos por El Cerrito (6,1%), Guacarí (5,2%), Florida (4,4%) y Jamundí (4,2%). Se observa que la actividad agrícola se concentra en la zona centro/sur y a la margen derecha del río Cauca, siendo la participación de los municipios de la zona norte-derecha del río Cauca poco representativa (Figura 3).

El sector secundario está conformado por los subsectores de Industria (28%) y Construcción (7%), donde Cali aporta el 45% del PIB del sector secundario, seguido de Yumbo con el 20%, y Palmira con el 9,5. Estos tres municipios (el 7% de las divisiones político administrativas del departamento) generan casi el 75% del PIB de la industria, lo que sugiere una alta concentración industrial en el Valle del Cauca (Figura 4).

El sector de servicios surge de sumar los subsectores de Comercio y Reparaciones (12%), Transporte (6%), Servicios Inmobiliarios y Financieros (22%), Servicios de Mercado (10%) y Servicios de No Mercado (4%). El municipio de Cali registra el 56,2% del PIB del sector Terciario, seguido por mucha diferencia de Palmira y Tuluá que aportan cada uno el 6,2%, Buenaventura con el 5,4%, Buga con el 3,3%, Cartago el 3,2%, Yumbo 2,9%, Candelaria 2,1% y Jamundí 1,9% (Figura 5). El resto de municipios (33) aportan solo el 10% del PIB del sector terciario. Asociados a la actividad agrícola e industrial, los servicios presentan una distribución espacial consistente con la importancia económica de los municipios, Cali, Palmira, Buga, Tuluá, Cartago y Yumbo son los municipios que más actividad de servicios genera, coincidiendo con las que históricamente se han considerado las ciudades más importantes dentro del departamento.

Con el fin de revisar la estructura productiva del departamento y conociendo su tradición agrícola e industrial, se realiza un mapa condicional 11 entre el PIB agrí- cola y el PIB Industrial (Figura 6) para cada uno de los municipios del Valle del Cauca. Los municipios de Cali, Buga, Bugalagrande, Candelaria, Palmira, Pradera, Zarzal, Tuluá, El Cerrito, Florida, Guacarí y Jamundí, registran alto PIB agrícola y se encuentran rodeados de municipios con alto PIB industrial, lo que supone que se concentra la producción agroindustrial del departamento. Por su parte Yumbo tiene un alto PIB industrial pero está en un nivel medio a nivel agrícola. Mientras que los municipios de Argelia, Bolívar, El Águila, El Cairo, El Dovio, La Cumbre, Trujillo, Ulloa, Versalles y Víjes, registran valores bajos tanto en el PIB agrícola como en el industrial.
Finalmente y con el propósito de validar si la técnica aplicada tiene un comportamiento satisfactorio en un escenario como el descrito para este ejercicio de aplicación, se lleva a cabo un análisis de consistencia de los datos al comparar la estimación con algunos resultados previos obtenidos en otros estudios. En general, la mayor parte de los métodos propuestos para la medición del PIB a nivel municipal se basan en

metodologías indirectas utilizadas por la Gobernación del Valle, como proyecciones vía crecimiento de la producción, uso de coeficientes técnicos de matrices insumo producto, ponderaciones de productos, participaciones a nivel nacional, entre otras. Por otra parte, solo Cali cuenta con una estimación del PIB municipal.
De acuerdo a lo anterior, se compara el PIB municipal de esta investigación con el PIB municipal calculado por la Gobernación para el año 2005 base 1994 y el Valor Agregado municipal del DANE, basando las comparaciones en la participación en el PIB municipal, más no en su valor 12.
De la comparación se puede deducir que después de Cali y Yumbo los siguientes ocho municipios presentan, excepto contadas excepciones, valores muy similares encontrándose la diferencia en el primer o segundo dígito de los decimales. Las diferencias más marcadas (de uno o dos puntos porcentuales) se presentan cuando se comparan los resultados de esta investigación con el cálculo del PIB realizado por la Gobernación, anotando que esta última medición se hace para el año 2005 —base 1994—, en tanto que la comparación con los resultados del DANE presenta valores

muy similares; de lo que se puede concluir que los resultados de esta investigación son consistentes con otras mediciones.
Aplicando las técnicas de entropía es posible obtener la información que se desea, en este caso el PIB municipal y por sectores económicos para el Valle del Cauca- Colombia, con un método muy eficiente en términos de coste, que posibilita realizar comparaciones dentro de las regiones que conforman un gran territorio, bajo un procedimiento homogéneo para todo ese conjunto territorial. Esta estimación para el Valle del Cauca representa un trabajo pionero que proporciona información municipal y desagregada a sectores económicos, lo cual es de suma utilidad en la región.
A nivel espacial y utilizando técnicas de análisis de datos espaciales, es pertinente mencionar que el sector agrícola se encuentra concentrado en los municipios de Palmira y Cali, seguidos por los municipios de Candelaria, Buga, El Cerrito, Guacarí, Florida, Jamundí, Pradera, Zarzal, Bugalagrande, Tuluá y San Pedro. Como se observa en los mapas la mayoría de los municipios del lado derecho del río Cauca son grandes productores del sector primario, bien sea del grupo de productos agrícolas o pecuario.
A través de este proyecto se consolida la importancia de la medición económica a nivel desagregado y mucho más a nivel municipal, para la aplicación de políticas económicas dirigidas a mejorar los niveles de producción y competitividad del departamento y de los municipios, así como de insumo de tipo académico para conocer la estructura productiva del departamento.
*: Este artículo surge como parte de un proyecto de tesis para optar al título de Maestría en Economía. La versión completa puede consultarse en la biblioteca de la Universidad Autónoma de Occidente de Cali, Colombia, http://red.uao.edu.co/bitstream/10614/7755/1/T05803.pdf. Los profesores V. Esteban Fernández y S. Henry Duque son los directores de dicha tesis.










