Análisis predictivo de la incidencia delictiva en Hidalgo a través de una regresión binomial negativa: una aportación cuantitativa para el diseño de política pública y modelos de intervención

Predictive analysis of the criminal incidence in Hidalgo through a negative binomial regression: A quantitative contribution to the design of public policy and intervention models

Mario Cruz Cruz *
Universidad Autónoma del Estado de Hidalgo, México
Juan Bacilio Guerrero Escamilla *
Universidad Autónoma del Estado de Hidalgo, México
Adrián González Romo *
Universidad Autónoma del Estado de Hidalgo, México

Análisis predictivo de la incidencia delictiva en Hidalgo a través de una regresión binomial negativa: una aportación cuantitativa para el diseño de política pública y modelos de intervención

Investigación Administrativa, vol. 48, núm. 122, 2018

Instituto Politécnico Nacional

Resumen: La mayor parte de la literatura existente sobre el delito explica este fenómeno a partir asociaciones de sentido común con variables como la corrupción, el desempleo y la pobreza. Contrario a ello, en el presente artículo se construye un modelo probabilístico (con investigación de operaciones) para aproximarnos a un análisis y proyección científica de esas variables, e identificar la que más incide en la comisión del delito en los 84 municipios del Estado de Hidalgo, México, a través de una regresión binomial negativa. Una vez aplicado el modelo y analizado los resultados, se concluye que la variable que más incide en la comisión del delito en el largo plazo es la corrupción, por lo que los funcionarios públicos que quieran combatir realmente el problema deberá de enfocarse a ésta.

Palabras clave: delincuencia, corrupción y modelo.

Abstract: Most of the existing literature on crime explains this phenomenon from common sense associations with variables such as corruption, unemployment and poverty. Contrary to this, this article builds a probabilistic model (with operations research) to approximate a scientific analysis and projection of these variables, and identify the one that most affects the commission of the crime in the 84 municipalities of Estado de Hidalgo, Mexico, through a negative binomial regression. Once the model has been applied and the results analyzed, it is concluded that the variable that most affects the commission of the crime in the long term is corruption, so that public officials who want to really fight the problem should focus on it.

Keywords: crime, corruption and model.

Introducción

La delincuencia es uno de los principales problemas sociales que actualmente enfrenta la sociedad mexicana, debido a que dicha actividad ha venido incrementándose en los últimos años. Este aumento delictivo tiene un impacto multinivel en la productividad, inversión, trabajo y consumo. Además, este flagelo obstaculiza el desarrollo y el crecimiento del país, ocasionando que cada año sean desviados una enorme cantidad recursos económicos para tratar de prevenir y combatir los efectos negativos que genera este fenómeno social.

De acuerdo con la Encuesta Nacional de Victimización y Prevención sobre Seguridad Pública realizada por INEGI, en el año de 2016 se estimó que 23.3 millones de personas fueron víctimas de la delincuencia, esto representó una tasa de prevalencia delictiva de 28,202 víctimas por cada 100 mil habitantes, donde el robo a mano armada y la extorsión fueron los delitos de mayor frecuencia (24.2% del total de los delitos ocurridos durante el 2016), esto género que el 72.9% de la población se sintiera insegura, ya sea en su trabajo, domicilio o en la calle (INEGI, 2016).

El Estado de Hidalgo[2] no ha estado exento de dicho fenómeno, pues de acuerdo con la Encuesta Nacional de Seguridad Pública Urbana elaborada por INEGI en 2016, el 61.8% de los hidalguenses se consideraron inseguros en su trabajo, domicilio o en la calle, debido a los más de 78 mil delitos [3](27 mil por cada 100 mil habitantes) registrados en la entidad, donde los de mayor frecuencia fueron la extorsión y el robo a mano armada (23.1% del total de delitos ocurridos durante el 2016 en la entidad). (INEGI, 2016).

Bajo este contexto, se han generado una serie de conjeturas sobre el comportamiento de dicho fenómeno social, identificando a la corrupción (ineficiencia de autoridades y poca transparencia), pobreza, desigualdad y desempleo como los factores que más inciden en el delito (Roel, 2015). Estas aseveraciones las han realizado a partir de matrices de correlación de Pearson (Roel, 2015), explicadas y en los resultados de las siguientes tablas:

Cruce
de variables con respecto a la delincuencia
Figura 1
Cruce de variables con respecto a la delincuencia
Forbes México (2015)

En la figura 1 se puede identificar el grado de correlación que existe entre la pobreza, la desigualdad, el desempleo y la corrupción con la delincuencia. No obstante, esta información así mostrada no permite pronosticar la dinámica prospectiva de dicho fenómeno.

En consecuencia, para predecir el comportamiento de la delincuencia y generar política pública y modelos de intervención es fundamental que se construya un modelo matemático o estadístico, mediante el cual se pueda tener una representación simplificada del fenómeno. Así, al expresar de forma matemática los elementos y las relaciones que interviene en la incidencia delictiva, se permitiría la evaluación de distintas soluciones factibles para la toma de decisiones.

En los países desarrollados el uso de modelos matemáticos o estadísticos para la toma de decisiones se han extendido. Son utilizados en las empresas, los hospitales, las instituciones financieras, las bibliotecas, en la planeación urbana, en los sistemas de transporte y aún en la criminología (Narro, 1996).

Por ello, es de suma importancia que los países latinoamericanos difundan el uso de esta herramienta, pues en periodos de crisis económicas y sociales se podrían encontrar soluciones a dichos problemas, ya que en otros países los modelos matemáticos y estadísticos han dado soluciones a problemas complejos. En esta perspectiva, se encuentra el modelo probabilístico desarrollado por Jeff Brantingham de la Universidad de Los Ángeles, cuyo objetivo era el identificar los movimientos de los delincuentes en la ciudad de Los Ángeles, tomando como referencia las acciones delictivas, pues a través de la búsqueda de patrones se predecía la próxima acción delictiva, con este modelo se pudo reducir en un 25% la delincuencia de la ciudad de los Ángeles (Guil, 2009).

El reto en este trabajo es generar un modelo que permita identificar patrones de comportamiento del delito en Hidalgo, mediante el uso de herramientas cuantitativas que desborden aseveraciones de sentido común y nos muestren realmente el papel que juegan los actores o nodos de la red delictiva que opera en la entidad y que prediga la incidencia delictiva en el largo plazo.

Finalmente, debe de indicarse que este trabajo se desmarca de apreciaciones políticas del desempeño de la autoridad en materia de combate y contención del delito, los resultados se extraen de estadísticas oficiales, por lo que no existe sesgo metodológico, con la intención de detectar los factores que más inciden en la comisión del delito y la corrupción en los 84 municipios del Estado de Hidalgo. De hecho, el análisis y creación de este modelo fortalece la línea de investigación que los autores siguen en otros trabajos (Cruz, 2018), donde se muestran los costos que erogan las empresas que han sido víctimas del delito y la corrupción, que al conjuntarse estas investigaciones seguramente se enriquecerán las interpretaciones.

Objetivos del estudio

El presente trabajo de investigación tiene la finalidad de construir un modelo probabilístico, en el cual se pronostique el comportamiento del fenómeno delictivo en el Estado de Hidalgo, pues esta entidad se ha convertido un polo de atracción de la delincuencia organizada, ya que su ubicación y cercanía con la Ciudad de México-Zona Metropolitana del centro del país, les permite vivir en una zona tranquila y barata pues los bajos costos que tiene la vivienda en dicha entidad son ampliamente inferiores a las demás zonas metropolitanas. En suma, el objetivo central de esta investigación es predecir la dinámica de incidencia delictiva en el Estado de Hidalgo, tomado como referencia la pobreza, el desempleo, la corrupción y desempeño de los ministerios públicos en la entidad durante el año 2015.

Método de investigación

Para la construcción de dicho modelo se utiliza la metodología de investigación de operaciones, la cual se conforma por cinco fases (Taha, 2012):

1era. fase: Planteamiento del problema. Consiste en definir los alcances del problema que se investigan, para lo cual se debe cumplir con tres elementos:

· Primer elemento: la delimitación de variables en el fenómeno de estudio.

· Segundo elemento: las fuentes de información para la construcción de la base de datos.

· Tercer elemento: los alcances y límites de la investigación.

2da. fase: Construcción del modelo. Radica en el planteamiento de la ecuación matemática a construir y de la selección adecua del tipo de modelaje que se requiere para el desarrollo de dicha ecuación.

3er. fase: Solución del modelo. En esta fase se calculan los parámetros de los distintos modelos, con la finalidad de seleccionar el de mejor ajuste a la información obtenida de las distintas fuentes.

4ta. fase: Validación del modelo. Una vez seleccionado el modelo de mejor ajuste, se procede a su validación, es decir, este debe cumplir con todos los supuestos de inferencia necesarios para su ejecución.

5ta. fase: Interpretación de parámetros. Al cumplir el modelo con supuestos de inferencia para su aplicación, se procede a la interpretación de sus parámetros, pues a través de ella se podrán construir escenarios alternativos del fenómeno en estudio.

1era Fase: Planteamiento del problema

Partiendo de tales conjeturas se tiene lo siguiente:


(1)

donde:

Yd- es la tasa de delitos por cada 100 mil habitantes en cada municipio del Estado de Hidalgo.

Xp- es la tasa pobrezas[4] en cada municipio del Estado de Hidalgo.

Xd- es la tasa de desempleo[5] en cada municipio del Estado de Hidalgo.

Xc- es el Tasa de delitos por cada 100 mil habitantes con corrupción[6] en cada municipio del Estado de Hidalgo.

Xmc- es el total de ministerios públicos[7] del fuero común en cada municipio del Estado de Hidalgo.

Xmf- es el total de ministerios públicos de fuero federal en cada municipio del Estado de Hidalgo.

Tabla 1
Fuentes de informacion de cada variable a modelar en el año 2015
VARIABLES FUENTES
Tasa de delitos por cada 100 mil habitantes (Yd) Secretaría de Seguridad Pública
Tasa de pobreza (Xp) CONEVAL
Tasa de desempleo (Xd) INEGI (Anuario Estadístico 2016)
Tasa de delitos con corrupción (Xc ) Secretaría de Seguridad Pública
Total de ministerios públicos del fuero común (Xmc) INEGI (Anuario Estadístico 2016)
Total de ministerios públicos del fuero federal (Xmf) INEGI (Anuario Estadístico 2016)
Elaboración personal

Dentro de los alcances y límites de la presente se encuentran los siguientes:

- Alcances:

· Mediante la construcción del presente modelo, se podrá predecir la dinámica de la delincuencia de la entidad, y con ello, se podrán evaluar las conjeturas que se han creado, en relación con sus causas.

· Desde el contexto del modelamiento, se podrán visualizar dos elementos: en primer lugar, el papel trascendental de las matemáticas y de la estadística sobre el pronóstico de fenómenos sociales; y en segundo lugar, la eficiencia de los modelos para la toma de decisiones.

- Límites:

· El modelo desarrollado en el presente trabajo es de corte transversal (información sólo de 2015), sería fundamental conocer su tendencia en los últimos años, a partir de las conjeturas que se tienen sobre sus posibles causas, sin embargo, no se cuenta con la suficiente información para desarrollar dicho modelo en esa magnitud.

· La tasa de delitos que se modela en el presente trabajo incluye todo tipo de delitos. Una alternativa sería el modelar alguno de estos delitos, con la finalidad de conocer sus causas y efectos sobre la población de forma diferenciada.

2da. Fase: Construcción del modelo

Desde el contexto de regresión lineal múltiple, el modelo a estimar sería de la siguiente forma (Montgomer & Runger, 2007):


donde:


Si la tasa de delitos es una variable aleatoria discreta (v.a.d.) (Wackerly, D. Mendenhall, W. & Scheaffer, R., 2010):




Esto debe ocurrir sobre el soporte Y, y que no depende de 0 . En el caso de distribuciones depende de K parámetros 0, se tiene que (Canavos, 2007):


Al ser una función de distribución de la familia exponencial, la media de la distribución depende de las variables independientes X, a través de la siguiente expresión (McCullagh, P. & Nelder, J., 1983).


Bajo estos contextos, debe ser ajustado a través de los Modelos Lineales Generalizados (GLM), los cuales son una extensión de los modelos lineales que permiten utilizar distribuciones no normales de la variable respuesta.

Los GLM tienen tres componentes: el primero, la distribución de Y; el segundo, la función liga; y el tercero, la función offset (Müller, 2004). Partiendo de estos tres componentes, Yd se comportaría y se modelaría de la siguiente forma:

- Comportamiento de Yd:


Tabla 2.
La función liga de las distribuciones poisson y binomial negativa
Distribución Función liga
Poisson Logarítmica, Identidad, Raíz cuadrada
Binomial negativa Logarítmica
Modelos Lineales Generalizados (Cayuela, 2010)

La función offset sirve para ambas distribuciones, su principal función es el poder controlar el efecto de manifestación de la variable respuesta y parte de una hipótesis funcional de interés (Carrascal, 2015).

Los GLM deben cumplir determinados supuestos para su evaluación, entre ellos se encuentran los siguientes (Lindsey, 1997):

- Mayor significancia de los parámetros estimados dentro del modelo.

- Criterio de Información Akaike (AIC). Evalúa el grado de ajuste del modelo a los datos como la complejidad del modelo.

AIC = -2LM + 2p

donde:

· LM es la máxima verosimilitud del modelo actual

· p es el número de parámetros estimados

Cuando más pequeño es el AIC mejor ajuste. Sirve para comparar modelos similares con distintos grados de complejidad.

- Los residuales de la devianza se deben aproximar a sus grados de libertad.

- Los residuales de la devianza deben aproximarse a una distribución normal.


- No debe existir multicolinealidad entre las variables explicativas del modelo.

- El grado de variabilidad de los datos se obtiene a través de la devianza, la cual se calcula de la siguiente forma:


donde:

· DN es la devianza nula (el modelo tiene una sola constante).

· DR es la devianza de los residuales (el modelo tiene la constante y las variables explicativas.

Considerando todo lo anterior, Yd es un conteo que tiene dos opciones de modelamiento (poisson ó binomial negativo), por tanto, su expresión lineal sería la siguiente:



Para la construcción de los modelos se va a utilizar el software RStudio (es un lenguaje S desarrollado por AT&T por Rick Becker, John Chambers y Allan Wilks (Sáez, 2012).

Referencias

Canavos, C. (2007). Probabilidad y Estadística. Aplicaciones y Métodos. Estados Unidos: Mc Graw Hill.

Carrascal, L. (2015). Modelos Generalizados Lineales con SPSS. España: Depto. Biogeografía Y cambio Climático.

Cayuela, L. (2010). Modelos Lineales Generalizados (GLM). España: Universidad de Granadas.

Cerimedo, F. (2002). Cuadernillos de Economía No. 65. Pobreza: definición, determinantes y programas para su erradicación. Argentina: Ministerio de Economía de la Provincia de Buenos Aires República de Argentina.

Colín, G. (1983). Derecho Mexicano de Procedimientos Penales. México: Universidad Nacional Autónoma de México.

Cruz, M., Guerrero, J., Sánchez, y Sosa, J. (2018) Comercio, inseguridad y captura institucional. Las distorsiones en las mipymes hidalguenses. México: UAEH-Plaza y Valdés.

Guil, J. (2009). Los policías deberían trabajar con matemáticos para resolver delitos. España: ABC.

Hernández, R. (2009). Introducción a la economía y la hacienda pública. España: Universidad de Valencia.

INEGI. (2016). Encuesta Nacional de Victimización y Percepción sobre Seguridad Pública (ENVIPE) 2016. México: Instituto Nacional de Estadística y Geografía.

Lindsey, J. (1997). Applying Generalized Linear Models. USA. Springer.

López, E. (2010). Análisis de datos con el Modelo Lineal Generalizado. Una Aplicación con R.

Machado, M. (2006). Construyendo Ciudadanía Forjamos un País sin Corrupción. Perú: Fórum Solidaridad Perú.

Machicado, J. (2010). Concepto de Delito. México: Apuntes Jurídicos.

Mc Cullagh, P. & Nelder, J. (1983). Monographs on Statistics and Applied Probability 37. Generalized Linear Models. USA: Chapman and Hall.

Montegomery, D. & Runger, G. (2007). Probabilidad y Estadística Aplicada a la Ingeniería: Estados Unidos. Limusa Wiley.

Müller, M. (2004). Generalized Linear Models. Germany: Fraunhofer Institute for Industrial Mathematics (ITWM).

Narro, A. (1996). Aplicación de algunos modelos matemáticos a la toma de decisiones. México: Política y Cultura.

Roel, S. (2015). ¿Cuáles son las causas de la violencia en México? México: Forbes México.

Taha, H. (2012). Investigación de Operaciones. Estado Unidos: Universidad de Arkansas. Pearson.

Sáez, A. (2012). Métodos Estadísticos con R y R Commander. España: Departamento de Estadística e Investigación de Operaciones de la Universidad de Jaén.

Sigüeñas, M. (2015). Pruebas de Normalidad. Perú: Universidad Nacional Agraria La Molina.

Seoane, J., Carmona, C., Tarjuelo, R. & Planillo, A. (2014). Análisis bioestadístico con modelos de regresión en R. España: Universidad Autónoma de Madrid.

Tusell, F. (2007). Estadística Matemática. España: Universidad del País Vasco.

Wackerly, D., MendenhalL, W. & Schaffer, R. (2010). Estadística Matemática con Aplicaciones. Estado Unidos: Cengage Learning.

Notas

[4] La pobreza puede entenderse como la falta de capacidad para alcanzar y mantener un nivel de vida aceptable. Por tanto, un “pobre” será aquel que sufre alguna “privación” que le impida el logro de este objetivo (Cerimedo, 2002).
2 El estado de Hidalgo se ubica en la región este del país y colinda con las entidades de San Luis Potosi, Ciudad de México, Veracruz, Puebla,Tlaxcala, Estado de México y Queretaro tiene una población aproximada de 3 millones de habitantes representa el 1.06% del territorio nacional y se divide en 84 municipios, cuya capital es Pachuca de Soto, su producto interno bruto es de aproximadamente 276 mil millones de pesos mexicanos y aporta el 1.7 del PIB nacional.
3 Un delito es un comportamiento antisocial, en el cual implica una violación de las normas vigentes, lo que hace que se meresca una pena.
5 El desempleo es parte de la población económicamente activa que no tiene trabajo. Es sinónimo de paro o desocupación. (Hernandez,2009).
6 La corrupción es el uso indebido del poder otorga para el beneficio privado. La corrupción entraña conductas por parte de funcionarios en el sector público o sus allegados , para los cuales se enriquecen indebida e ilegalmente mediante el mal uso del poder que se les ha confiado (Machado, 2006).
7 El ministerio público es una institución independiente del Estado (Poder Ejecutivo), que actua en representación del interés social en el ejercicio de la acción penal y la tutela social , en todos aquellos casos que le asignan las leyes (Colin,1983).
8 Debido a que la información no tiene simetría , a todas las variables explicativas se les aplicó el logaritmo natural , aunado a esto , las variables Xf y Xm se les sumo la unidad . A través de esto , lograr hacer simetríca la información .

Notas de autor

* Licenciado en Economía por la Escuela Superior de Economía del Instituto Politécnico Nacional (IPN), Maestro en Estudios en Relaciones Internacionales por la Facultad de Ciencias Políticas y Sociales de la Universidad Nacional Autónoma de México (UNAM), tiene un Doctorado en Ciencias Políticas y Sociales con orientación en Relaciones Internacionales por la UNAM, Programa del CONACYT de Competencia Internacional. Es Profesor de Tiempo Completo en el Programa Educativo de Comercio Exterior del Instituto de Ciencias Económico Administrativas (ICEA) de la UAEH y columnista del periódico El Independiente. Actualmente es miembro del Sistema Nacional de Investigadores (SNI-C) y tiene el Reconocimiento a Profesores de Tiempo Completo con Perfil Deseable del Programa de Mejoramiento del Profesorado (PROMEP) y es Líder del Cuerpo Académico Estudios del Comercio Internacional del ICEA. El Dr. Cruz ha publicado varios artículos a nivel nacional e internacional en las líneas de investigación que cultiva: Geopolítica del Comercio Exterior, Políticas Públicas Multisectoriales y Mercados Ilícitos. Su último libro (2017) COMERCIO, INSEGURIDAD Y CAPTURA INSTITUCIONAL. Las distorsiones en las Mipymes hidalguenses, Coedición UAEH-Plaza y Valdés. Teléfono (771) 71 72000 ext. 4171 Correo electrónico: mariocruzcruz@gmail.com. Código ORCID: https://orcid.org/0000-0003-1399-9223.
* Licenciado en Economía por la Universidad Autónoma del Estado de Hidalgo, es Maestro en Ciencias en Matemáticas por el Área Académica de Matemáticas y Física de la Universidad Autónoma del Estado de Hidalgo, también es Maestro en Probabilidad y Estadística del Instituto de Investigaciones en Matemáticas y Sistemas de la Universidad Nacional Autónoma de México, tiene un Diplomado en Econometría Aplicada del Instituto Politécnico Nacional, es Doctor en Ciencias Sociales de la Universidad Autónoma del Estado de Hidalgo y tiene un Posdoctorado en Econometría por parte del Instituto Politécnico Nacional. Profesor investigador del Instituto de Ciencias Sociales y Humanidades dentro del Área Académica de Sociología y Demografía, sus líneas de investigación son el modelamiento matemático y estadístico en las Ciencias Sociales y en el Medio Ambiente. Actualmente es miembro del Sistema Nacional de Investigadores (SNI-C). Ha publicado varios artículos, entre los cuales destacan: Construcción del Índice de Cohesión Social para México a través de Componentes Principales, Predicción de la Tasa de Delincuencia a través del Índice de Cohesión Social, Modelamiento Probabilístico de la Incidencia Delictiva en Michoacán, Predicción de los Gases de Efecto Invernadero en el Estado de Hidalgo. Teléfono (771) 71 72000 ext. 5206. Correos electrónicos: guerreroescamilla@yahoo.com.mx. Código ORCID: https://orcid.org/0000-0002-0971-7564.
* Doctor en Ciencias, con especialidad en Estrategias para el Desarrollo Agrícola Regional, Colegio de Postgraduados-Campus Puebla. Profesor-Investigador de la Universidad Autónoma del Estado de Hidalgo, Instituto de Ciencias Económico Administrativas–Comercio Exterior. SNI I. Línea de investigación: Economía Internacional, Migración Internacional, Política Social y Pobreza. Tel: (771) 71 72000 ext. 4171. Correo electrónico: aromo@colpos.mx Código ORCID http://orcid.org/0000-0003-1954-5185

mariocruzcruz@gmail.com

Información adicional

Clasificación JEL: J48 : J48

HTML generado a partir de XML-JATS4R por