Abstract Data mining in the context of criminal occupation risk focuses on the application of analytical techniques to identify patterns, trends and correlations that may indicate the presence of illegal armed groups in the territories. The study presents the calculation of the risks of occupation by the illegal groups Clan del Golfo, Ejército de Liberación Nacional (ELN) and Los Pachelly in the municipalities of the department of Antioquia in Colombia. For this purpose, the databases used correspond to open sources such as the Statistical, Criminal, Contraventional and Operational Information System of the National Police (SIEDCO), the Directorate of Criminal Investigation and INTERPOL (DIJIN), the Colombian Drug Information System (SIDCO), the Ministry of Defence, the National Institute of Legal Medicine, the Land Observatory, the Unit for the Attention and Integral Reparation of Victims, the Ombudsman’s Office, the Directorate of Substitution of Illicitly Used Crops, the E. S.E. Hospital Carisma, the Departmental Information Directorate-Government of Antioquia, the National Administrative Department of Statistics (DANE) and the Ministry of National Education. We also used the Cross Industry Standard Process for Data Mining (CRISP-DM) methodology and combined principal component analysis (PCA) and the Fuzzy c-Means (FCM) technique to identify in the data the social, economic, labour, educational and criminal variables that most contribute to the risk of the presence of criminal structures in the municipalities, which allowed us to classify them as low risk, medium risk, medium-high risk, high risk and very high risk. The results show that 26% of the municipalities would have a high risk for the Clan del Golfo, 11% for the ELN and another 12% for Los Pachelly. Furthermore, it was found that the results can be used in a prototype of an integrated early warning system to detect risks of criminal occupation.
Resumo A mineração de dados no contexto do risco de ocupação criminosa concentra-se na aplicação de técnicas analíticas para identificar padrões, tendências e correlações que possam indicar a presença de grupos armados ilegais nos territórios. O estudo apresenta o cálculo dos riscos de ocupação pelos grupos ilegais Clan del Golfo, Ejército de Liberación Nacional (ELN) e Los Pachelly nos municípios do departamento de Antioquia, na Colômbia. Para isso, os bancos de dados utilizados correspondem a fontes abertas, como o Sistema de Informação Estatística, Criminosa, Contravencional e Operacional da Polícia Nacional, a Direção de Investigação Criminosa e Interpol, o Sistema de Informação sobre Drogas da Colômbia, o Ministério da Defesa, o Instituto Nacional de Medicina Legal, o Observatório da Terra, a Unidade de Atenção e Reparação Integral de Vítimas, a Defensoria do Povo, a Direção de Substituição de Cultivos de Uso Ilícito, o E.S.E. Hospital Carisma, o Centro de Estudos de Drogas e o Centro de Estudos de Drogas da Colômbia. S.E. Hospital Carisma, a Direção de Informação Estadual-Governo de Antioquia, o Departamento Administrativo Nacional de Estatística e o Ministério de Educação Nacional. També musamos a metodologia Cross Industry Standard Process for Data Mining e combinamos a análise de componentes principais e a técnica Fuzzy c-Means (FCM) para identificar nos dados as variáveis sociais, econômicas, trabalhistas, educacionais e criminais que mais contribuem para o risco de presença de estruturas criminosas nos municípios, o que permitiu classificá-los como de baixo risco, médio risco, médio-alto risco, alto risco e muito alto risco. Os resultados mostram que 26 % dos municípios estão em alto risco para o Clã do Golfo, 11 % para o ELN e outros 12 % para Los Pachelly. Além disso, verificou-se que os resultados podem ser usados em um protótipo de um sistema integrado de alerta precoce para detectar riscos de ocupação criminosa.
Resumen La minería de datos en el contexto del riesgo de ocupación criminal, se centra en la aplicación de técnicas analíticas para identificar patrones, tendencias y correlaciones que puedan indicar la presencia de grupos armados ilegales en los territorios. El estudio presenta el cálculo de los riesgos de ocupación por parte de los grupos ilegales Clan del Golfo, Ejército de Liberación Nacional (ELN) y Los Pachelly en los municipios del departamento de Antioquia en Colombia. Para ello, las bases de datos utilizadas corresponden a fuentes abiertas como el Sistema de Información Estadístico, Delincuencial, Contravencional y Operativo de la Policía Nacional (SIEDCO), la Dirección de Investigación Criminal e INTERPOL (DIJIN), el Sistema de Información de Drogas de Colombia (SIDCO), el Ministerio de Defensa, el Instituto Nacional de Medicina Legal, el Observatorio de Tierras, la Unidad para la Atención y Reparación Integral a las Víctimas, la Defensoría del Pueblo, la Dirección de Sustitución de Cultivos de Uso Ilícito, la E.S.E. Hospital Carisma, la Dirección de Información Departamental-Gobernación de Antioquia, el Departamento Administrativo Nacional de Estadística (DANE) y el Ministerio de Educación Nacional. Asimismo, utilizamos la metodología Cross Industry Standard Process for Data Mining (CRISP-DM) y se combinó el análisis de componentes principales (ACP) y la técnica Fuzzy c-Means (FCM) para identificar en los datos las variables sociales, económicas, laborales, educacionales y criminales que mayormente aportan al riesgo de presencia de las estructuras criminales en los municipios, lo que permitió clasificarlos en riesgo bajo, riesgo medio, riesgo medio-alto, riesgo alto y riesgo muy alto. Los resultados muestran que el 26 % de los municipios tendrían un riesgo alto para el Clan del Golfo, el 11 % con el ELN y otro 12 % para Los Pachelly. Además, se encontró que los resultados pueden utilizarse en un prototipo de un sistema integrado de alerta temprana para detectar riesgos de ocupación criminal.