Resumo Neste artigo, técnicas preditivas de mineração de dados são aplicadas para descobrir padrões de desempenho acadêmico na competência linguística dos testes Saber 5 apresentados por alunos de escolas primárias colombianas em 2017. Para isso, foi usada a metodologia CRISP-DM e o socioeconômico, foram consideradas as informações acadêmicas e institucionais das bases de dados do ICFES. Um conjunto de dados mineráveis foi obtido usando técnicas de limpeza e transformação de dados e uma árvore de decisão foi construída com o algoritmo J48 da ferramenta Weka. Entre os preditores dos padrões descobertos estão a natureza e a localização da escola, se os alunos foram ou não reprovados, a faixa etária, a escolaridade da mãe e as taxas de TIC e eletrodomésticos nas residências. O conhecimento produzido nesta pesquisa é informação de qualidade para a tomada de decisões nos MEN e nas secretarias de educação e para os diretores de instituições de educação primária definirem planos de melhoria que resultem na qualidade da educação na Colômbia.
Abstract In this paper, predictive data mining techniques are applied to determine the academic performance from fifth grade students in the Saber 5° tests Language skill at Colombian elementary schools in 2017. We employed the CRISP-DM methodology. Socioeconomic, academic, and institutional information was available at the ICFES databases. A minable dataset was obtained using data cleaning and transformation techniques. A decision tree was built with the Weka tool J48 algorithm. Some of the predictors of the discovered patterns are the nature and location of the school, whether or not students failed a school year, the age group, the mother's educational attainment, and the rates of ICTs and household appliances. The findings of this research serve as quality information for the decision-making at the Ministry of National Education (MEN) and the secretaries of education, and for the directors of elementary educational institutions to define improvement plans that result in the quality of elementary school education in Colombia.
Resumen En este artículo se aplican técnicas predictivas de minería de datos para descubrir patrones de desempeño académico en la competencia de Lenguaje de las pruebas Saber 5° que presentaron los estudiantes de las instituciones educativas colombianas de básica primaria en el año 2017. Para tal fin, se utilizó la metodología CRISP-DM y se tuvo en cuenta la información socioeconómica, académica e institucional de las bases de datos del ICFES. Se obtuvo un conjunto de datos minable utilizando técnicas de limpieza y transformación de datos y se construyó un árbol de decisión con el algoritmo J48 de la herramienta Weka. Entre los factores predictores de los patrones descubiertos están la naturaleza y la ubicación del colegio, si los estudiantes reprobaron o no algún grado, el grupo etario, la educación de la madre y los índices de TICs y electrodomésticos en los hogares. El conocimiento producido en esta investigación es información de calidad para la toma de decisiones en el MEN y las secretarías de educación y para que las directivas de las instituciones educativas de básica primaria definan planes de mejoramiento que redunden en la calidad de la educación en Colombia.