Resumen: La mayor parte de la literatura existente sobre el delito explica este fenómeno a partir asociaciones de sentido común con variables como la corrupción, el desempleo y la pobreza. Contrario a ello, en el presente artículo se construye un modelo probabilístico (con investigación de operaciones) para aproximarnos a un análisis y proyección científica de esas variables, e identificar la que más incide en la comisión del delito en los 84 municipios del Estado de Hidalgo, México, a través de una regresión binomial negativa. Una vez aplicado el modelo y analizado los resultados, se concluye que la variable que más incide en la comisión del delito en el largo plazo es la corrupción, por lo que los funcionarios públicos que quieran combatir realmente el problema deberá de enfocarse a ésta.
Palabras clave:delincuenciadelincuencia, corrupción y modelo corrupción y modelo.
Abstract: Most of the existing literature on crime explains this phenomenon from common sense associations with variables such as corruption, unemployment and poverty. Contrary to this, this article builds a probabilistic model (with operations research) to approximate a scientific analysis and projection of these variables, and identify the one that most affects the commission of the crime in the 84 municipalities of Estado de Hidalgo, Mexico, through a negative binomial regression. Once the model has been applied and the results analyzed, it is concluded that the variable that most affects the commission of the crime in the long term is corruption, so that public officials who want to really fight the problem should focus on it.
Keywords: crime, corruption and model.
Análisis predictivo de la incidencia delictiva en Hidalgo a través de una regresión binomial negativa: una aportación cuantitativa para el diseño de política pública y modelos de intervención
Predictive analysis of the criminal incidence in Hidalgo through a negative binomial regression: A quantitative contribution to the design of public policy and intervention models
La delincuencia es uno de los principales problemas sociales que actualmente enfrenta la sociedad mexicana, debido a que dicha actividad ha venido incrementándose en los últimos años. Este aumento delictivo tiene un impacto multinivel en la productividad, inversión, trabajo y consumo. Además, este flagelo obstaculiza el desarrollo y el crecimiento del país, ocasionando que cada año sean desviados una enorme cantidad recursos económicos para tratar de prevenir y combatir los efectos negativos que genera este fenómeno social.
De acuerdo con la Encuesta Nacional de Victimización y Prevención sobre Seguridad Pública realizada por INEGI, en el año de 2016 se estimó que 23.3 millones de personas fueron víctimas de la delincuencia, esto representó una tasa de prevalencia delictiva de 28,202 víctimas por cada 100 mil habitantes, donde el robo a mano armada y la extorsión fueron los delitos de mayor frecuencia (24.2% del total de los delitos ocurridos durante el 2016), esto género que el 72.9% de la población se sintiera insegura, ya sea en su trabajo, domicilio o en la calle (INEGI, 2016).
El Estado de Hidalgo[2] no ha estado exento de dicho fenómeno, pues de acuerdo con la Encuesta Nacional de Seguridad Pública Urbana elaborada por INEGI en 2016, el 61.8% de los hidalguenses se consideraron inseguros en su trabajo, domicilio o en la calle, debido a los más de 78 mil delitos [3](27 mil por cada 100 mil habitantes) registrados en la entidad, donde los de mayor frecuencia fueron la extorsión y el robo a mano armada (23.1% del total de delitos ocurridos durante el 2016 en la entidad). (INEGI, 2016).
Bajo este contexto, se han generado una serie de conjeturas sobre el comportamiento de dicho fenómeno social, identificando a la corrupción (ineficiencia de autoridades y poca transparencia), pobreza, desigualdad y desempleo como los factores que más inciden en el delito (Roel, 2015). Estas aseveraciones las han realizado a partir de matrices de correlación de Pearson (Roel, 2015), explicadas y en los resultados de las siguientes tablas:

En la figura 1 se puede identificar el grado de correlación que existe entre la pobreza, la desigualdad, el desempleo y la corrupción con la delincuencia. No obstante, esta información así mostrada no permite pronosticar la dinámica prospectiva de dicho fenómeno.
En consecuencia, para predecir el comportamiento de la delincuencia y generar política pública y modelos de intervención es fundamental que se construya un modelo matemático o estadístico, mediante el cual se pueda tener una representación simplificada del fenómeno. Así, al expresar de forma matemática los elementos y las relaciones que interviene en la incidencia delictiva, se permitiría la evaluación de distintas soluciones factibles para la toma de decisiones.
En los países desarrollados el uso de modelos matemáticos o estadísticos para la toma de decisiones se han extendido. Son utilizados en las empresas, los hospitales, las instituciones financieras, las bibliotecas, en la planeación urbana, en los sistemas de transporte y aún en la criminología (Narro, 1996).
Por ello, es de suma importancia que los países latinoamericanos difundan el uso de esta herramienta, pues en periodos de crisis económicas y sociales se podrían encontrar soluciones a dichos problemas, ya que en otros países los modelos matemáticos y estadísticos han dado soluciones a problemas complejos. En esta perspectiva, se encuentra el modelo probabilístico desarrollado por Jeff Brantingham de la Universidad de Los Ángeles, cuyo objetivo era el identificar los movimientos de los delincuentes en la ciudad de Los Ángeles, tomando como referencia las acciones delictivas, pues a través de la búsqueda de patrones se predecía la próxima acción delictiva, con este modelo se pudo reducir en un 25% la delincuencia de la ciudad de los Ángeles (Guil, 2009).
El reto en este trabajo es generar un modelo que permita identificar patrones de comportamiento del delito en Hidalgo, mediante el uso de herramientas cuantitativas que desborden aseveraciones de sentido común y nos muestren realmente el papel que juegan los actores o nodos de la red delictiva que opera en la entidad y que prediga la incidencia delictiva en el largo plazo.
Finalmente, debe de indicarse que este trabajo se desmarca de apreciaciones políticas del desempeño de la autoridad en materia de combate y contención del delito, los resultados se extraen de estadísticas oficiales, por lo que no existe sesgo metodológico, con la intención de detectar los factores que más inciden en la comisión del delito y la corrupción en los 84 municipios del Estado de Hidalgo. De hecho, el análisis y creación de este modelo fortalece la línea de investigación que los autores siguen en otros trabajos (Cruz, 2018), donde se muestran los costos que erogan las empresas que han sido víctimas del delito y la corrupción, que al conjuntarse estas investigaciones seguramente se enriquecerán las interpretaciones.
El presente trabajo de investigación tiene la finalidad de construir un modelo probabilístico, en el cual se pronostique el comportamiento del fenómeno delictivo en el Estado de Hidalgo, pues esta entidad se ha convertido un polo de atracción de la delincuencia organizada, ya que su ubicación y cercanía con la Ciudad de México-Zona Metropolitana del centro del país, les permite vivir en una zona tranquila y barata pues los bajos costos que tiene la vivienda en dicha entidad son ampliamente inferiores a las demás zonas metropolitanas. En suma, el objetivo central de esta investigación es predecir la dinámica de incidencia delictiva en el Estado de Hidalgo, tomado como referencia la pobreza, el desempleo, la corrupción y desempeño de los ministerios públicos en la entidad durante el año 2015.
Para la construcción de dicho modelo se utiliza la metodología de investigación de operaciones, la cual se conforma por cinco fases (Taha, 2012):
1era. fase: Planteamiento del problema. Consiste en definir los alcances del problema que se investigan, para lo cual se debe cumplir con tres elementos:
· Primer elemento: la delimitación de variables en el fenómeno de estudio.
· Segundo elemento: las fuentes de información para la construcción de la base de datos.
· Tercer elemento: los alcances y límites de la investigación.
2da. fase: Construcción del modelo. Radica en el planteamiento de la ecuación matemática a construir y de la selección adecua del tipo de modelaje que se requiere para el desarrollo de dicha ecuación.
3er. fase: Solución del modelo. En esta fase se calculan los parámetros de los distintos modelos, con la finalidad de seleccionar el de mejor ajuste a la información obtenida de las distintas fuentes.
4ta. fase: Validación del modelo. Una vez seleccionado el modelo de mejor ajuste, se procede a su validación, es decir, este debe cumplir con todos los supuestos de inferencia necesarios para su ejecución.
5ta. fase: Interpretación de parámetros. Al cumplir el modelo con supuestos de inferencia para su aplicación, se procede a la interpretación de sus parámetros, pues a través de ella se podrán construir escenarios alternativos del fenómeno en estudio.
1era Fase: Planteamiento del problema
Partiendo de tales conjeturas se tiene lo siguiente:

donde:
Yd- es la tasa de delitos por cada 100 mil habitantes en cada municipio del Estado de Hidalgo.
Xp- es la tasa pobrezas[4] en cada municipio del Estado de Hidalgo.
Xd- es la tasa de desempleo[5] en cada municipio del Estado de Hidalgo.
Xc- es el Tasa de delitos por cada 100 mil habitantes con corrupción[6] en cada municipio del Estado de Hidalgo.
Xmc- es el total de ministerios públicos[7] del fuero común en cada municipio del Estado de Hidalgo.
Xmf- es el total de ministerios públicos de fuero federal en cada municipio del Estado de Hidalgo.

Dentro de los alcances y límites de la presente se encuentran los siguientes:
- Alcances:
· Mediante la construcción del presente modelo, se podrá predecir la dinámica de la delincuencia de la entidad, y con ello, se podrán evaluar las conjeturas que se han creado, en relación con sus causas.
· Desde el contexto del modelamiento, se podrán visualizar dos elementos: en primer lugar, el papel trascendental de las matemáticas y de la estadística sobre el pronóstico de fenómenos sociales; y en segundo lugar, la eficiencia de los modelos para la toma de decisiones.
- Límites:
· El modelo desarrollado en el presente trabajo es de corte transversal (información sólo de 2015), sería fundamental conocer su tendencia en los últimos años, a partir de las conjeturas que se tienen sobre sus posibles causas, sin embargo, no se cuenta con la suficiente información para desarrollar dicho modelo en esa magnitud.
· La tasa de delitos que se modela en el presente trabajo incluye todo tipo de delitos. Una alternativa sería el modelar alguno de estos delitos, con la finalidad de conocer sus causas y efectos sobre la población de forma diferenciada.
2da. Fase: Construcción del modelo
Desde el contexto de regresión lineal múltiple, el modelo a estimar sería de la siguiente forma (Montgomer & Runger, 2007):

donde:

Si la tasa de delitos es una variable aleatoria discreta (v.a.d.) (Wackerly, D. Mendenhall, W. & Scheaffer, R., 2010):



Esto debe ocurrir sobre el soporte Y, y que no depende de 0 . En el caso de distribuciones depende de K parámetros 0, se tiene que (Canavos, 2007):

Al ser una función de distribución de la familia exponencial, la media de la distribución depende de las variables independientes X, a través de la siguiente expresión (McCullagh, P. & Nelder, J., 1983).

Bajo estos contextos, debe ser ajustado a través de los Modelos Lineales Generalizados (GLM), los cuales son una extensión de los modelos lineales que permiten utilizar distribuciones no normales de la variable respuesta.
Los GLM tienen tres componentes: el primero, la distribución de Y; el segundo, la función liga; y el tercero, la función offset (Müller, 2004). Partiendo de estos tres componentes, Yd se comportaría y se modelaría de la siguiente forma:
- Comportamiento de Yd:


La función offset sirve para ambas distribuciones, su principal función es el poder controlar el efecto de manifestación de la variable respuesta y parte de una hipótesis funcional de interés (Carrascal, 2015).
Los GLM deben cumplir determinados supuestos para su evaluación, entre ellos se encuentran los siguientes (Lindsey, 1997):
- Mayor significancia de los parámetros estimados dentro del modelo.
- Criterio de Información Akaike (AIC). Evalúa el grado de ajuste del modelo a los datos como la complejidad del modelo.
AIC = -2LM + 2p
donde:
· LM es la máxima verosimilitud del modelo actual
· p es el número de parámetros estimados
Cuando más pequeño es el AIC mejor ajuste. Sirve para comparar modelos similares con distintos grados de complejidad.
- Los residuales de la devianza se deben aproximar a sus grados de libertad.
- Los residuales de la devianza deben aproximarse a una distribución normal.

- No debe existir multicolinealidad entre las variables explicativas del modelo.
- El grado de variabilidad de los datos se obtiene a través de la devianza, la cual se calcula de la siguiente forma:

donde:
· DN es la devianza nula (el modelo tiene una sola constante).
· DR es la devianza de los residuales (el modelo tiene la constante y las variables explicativas.
Considerando todo lo anterior, Yd es un conteo que tiene dos opciones de modelamiento (poisson ó binomial negativo), por tanto, su expresión lineal sería la siguiente:


Para la construcción de los modelos se va a utilizar el software RStudio (es un lenguaje S desarrollado por AT&T por Rick Becker, John Chambers y Allan Wilks (Sáez, 2012).
Clasificación JEL: J48
: J48
mariocruzcruz@gmail.com















