Resumen: Predecir el comportamiento de los contaminantes atmosféricos se ha convertido en un importante insumo para el diseño de estrategias gubernamentales de contingencia que buscan mitigar los niveles de contaminación, por tal motivo esta investigación presenta una metodología para predecir el incumplimiento de los índices máximos permitidos para el material particulado contaminante PM2.5, a partir de modelos estadísticos multivariados que pueden ser utilizados para entender cómo diversas variables meteorológicas influyen en el comportamiento del contaminante, al igual que como forma de seleccionar las variables que serán usadas durante el entrenamiento de un clasificador bayesiano de redes neuronales. Además del modelo multivariado, se aplicó un análisis de varianza multifactorial para evaluar el efecto del día, hora y mes en la media del PM2.5. Como resultados principales, se encontró que las variables: dirección del viento, temperatura, humedad, presión atmosférica, precipitación, radiación solar, hora del día, día de la semana y mes, fueron estadísticamente significativas y permitieron entrenar una red neuronal con una capacidad de pronóstico del 78,2 % de manera global y del 81 % en los casos de incumplimiento, demostrando así que con variables factibles de manejar (variables meteorológicas, hora, día y mes) se puede diseñar una herramienta de pronóstico muy útil como insumo para la gestión sobre la calidad del aire.
Abstract: Predicting the behavior of atmospheric pollutants has become a crucial input for the design of government contingency strategies aiming to mitigate pollution levels. For this reason, this research presents a methodology to predict the non-compliance with the maximum allowed indices for the particulate matter pollutant PM2.5. The approach involves multivariate statistical models that can be used to understand how various meteorological variables influence the pollutant's behavior. It also serves as a means of selecting variables for training a Bayesian neural network classifier. In addition to the multivariate model, a multifactorial analysis of variance was applied to assess the effect of day, hour, and month on the mean PM2.5 levels. The main results revealed that variables such as wind direction, temperature, humidity, atmospheric pressure, precipitation, solar radiation, time of day, day of the week, and month were statistically significant. These variables allowed the training of a neural network with an overall predictive capacity of 78.2%, reaching 81% accuracy in cases of noncompliance. This demonstrates that with manageable variables (meteorological variables, time, day, and month), a highly useful forecasting tool can be designed to contribute to air quality management.