Resumen En Colombia, todos los estudiantes de pregrado, sin importar el programa de formación profesional que cursen, deben presentar las pruebas de competencias genéricas del examen Saber Pro que incluyen: Lectura Crítica, Razonamiento Cuantitativo, Competencias Ciudadanas, Comunicación Escrita e inglés. En este artículo se presenta la aplicación de la técnica de clasificación basada en árboles de decisión para predecir el desempeño en la prueba de Lectura Crítica del examen Saber Pro que presentaron los estudiantes de la Pontificia Universidad Javeriana Cali en los años 2017 y 2018. Se utilizó la metodología CRISP-DM. A partir de los datos socioeconómicos, académicos e institucionales almacenados en las bases de datos del ICFES, se construyó, limpio y transformó un repositorio de datos. Se obtuvo una vista minable compuesta por 2052 registros y 17 atributos. Se utilizó el algoritmo J48 de la herramienta Weka para construir el árbol de decisión. De acuerdo con los resultados obtenidos, se destacaron los programas de Filosofía, Matemáticas Aplicadas y Medicina por tener el mejor desempeño en esta prueba. Entre las variables predictoras asociadas al desempeño en la competencia de Lectura Crítica, están la facultad, el grupo etario y el índice de transporte del estudiante, como tres variables importantes relacionadas al buen o bajo desempeño académico de los estudiantes de la Universidad Javeriana Cali. El conocimiento generado en esta investigación, se constituye en información de calidad para soportar la toma de decisiones de las directivas universitarias en vía del mejoramiento de la calidad de la educación superior que se brinda en esta institución.
Abstract In Colombia, all undergraduate students, regardless of the professional training program they take, must complete the general competencies sections of the Saber Pro exam that include Critical Reading, Quantitative Reasoning, Citizen Competencies, Written Communication, and English. This paper presents the application of the classification technique based on decision trees in the prediction of the performance in the Critical Reading section presented by the students of the Pontificia Universidad Javeriana Cali in the years 2017 and 2018. The CRISP methodology was used. From the socioeconomic, academic and institutional data stored in the ICFES databases, a data repository was built, cleaned and transformed. A mineable view composed of 2052 records and 17 attributes was obtained. The J48 algorithm of the Weka tool was used to build the decision tree. The score obtained in the Critical Reading section of the Saber Pro exam was taken as a class. According to the results obtained, the Philosophy, Applied Mathematics, and Medicine programs stood out for having the best performance in this test. Among the predictive variables associated with performance in the Critical Reading skill are the faculty, the age group and the student's transportation index, as three important variables related to the good or low academic performance of the students of the Universidad Javeriana Cali. The knowledge generated in this research is constituted in quality information to support the decision-making process of the university directives in order to improve the quality of the higher education offered in this institution.
Resumo Na Colômbia, todos os alunos de graduação, independentemente do programa de treinamento profissional que estejam cursando, devem apresentar os testes de habilidades genéricas do exame Saber Pro que incluem: Leitura Crítica, Raciocínio Quantitativo, Competências Cidadãs, Comunicação Escrita e Inglês. Este artigo apresenta a aplicação da técnica de classificação baseada em árvores de decisão para predizer o desempenho na prova de Leitura Crítica do exame Saber Pro apresentada pelos alunos da Pontificia Universidad Javeriana Cali nos anos de 2017 e 2018. Foi utilizado o CRISP- Metodologia DM. A partir dos dados socioeconômicos, acadêmicos e institucionais armazenados nas bases de dados do ICFES, um repositório de dados foi construído, limpo e transformado. Foi obtida uma vista lavrável composta por 2.052 registros e 17 atributos. O algoritmo J48 da ferramenta Weka foi usado para construir a árvore de decisão. De acordo com os resultados obtidos, os programas de Filosofia, Matemática Aplicada e Medicina destacaram-se por ter o melhor desempenho nesta prova. Entre as variáveis preditivas associadas ao desempenho na competência Leitura Crítica, encontram-se o corpo docente, a faixa etária e o índice de transporte do aluno, três importantes variáveis relacionadas ao bom ou baixo desempenho acadêmico dos alunos da Universidad Javeriana Cali. O conhecimento gerado nesta pesquisa constitui-se em informação de qualidade para subsidiar a tomada de decisão das diretrizes da universidade no sentido de melhorar a qualidade do ensino superior que é oferecido nesta instituição.