RESUMO OBJETIVO Apresentar um protocolo para a crítica dos dados sobre monitoramento do fluoreto na água com recursos de programação do software R, ilustrando sua aplicação para descrever a cobertura dos dados e a qualidade da fluoretação em 2015. MÉTODOS Foi utilizado big data proveniente do Sistema de Informação de Vigilância da Qualidade da Água para Consumo Humano que incluía todos os municípios brasileiros. Os procedimentos de crítica dos dados foram realizados com auxílio do software R. Aplicaram-se filtros para remover municípios com menos de quatro meses de registro (1), e registros com valores nulos (2) e aberrantes (3). Os municípios foram classificados quanto à presença de informações válidas e à qualidade da fluoretação segundo macrorregião, unidades da federação e porte populacional, apresentando-se o script em cada passo. RESULTADOS Foram analisados aproximadamente 134 mil registros. Dos municípios brasileiros, 39% possuíam dados sobre o parâmetro fluoreto e apenas 33,3% apresentaram quatro meses ou mais de frequência de informação. Após a aplicação dos filtros, 1.810 (32,5%) municípios apresentaram informação válida para o parâmetro fluoreto, com substancial variação entre as macrorregiões Sul (83,6%) e Norte (0,7%). Destes, 726 (40,1%) exibiram muito boa qualidade da fluoretação, determinada por 80% ou mais de registros dentro do intervalo concentração ótima para prevenção da cárie dentária, com valor mais alto (54,3%) nos municípios com 50 mil habitantes ou mais e mais baixo (34,2%) naqueles com menos de 10 mil habitantes. CONCLUSÕES Persistem importantes diferenças entre e dentro das macrorregiões brasileiras no que se refere tanto à disponibilidade da informação sobre o parâmetro quanto à qualidade da fluoretação da água nos sistemas de abastecimento público no Brasil. O protocolo para crítica e manuseio dos dados com recursos de programação do software R se mostrou bastante útil para produção de informação voltada a tomada de decisão ancorada em método padronizado.
ABSTRACT OBJECTIVE To present a protocol to criticize data on fluoride monitoring in water with R software programming features, illustrating its application to describe data coverage, and fluoridation quality in 2015. METHODS The study used big data from the Sistema de Informação de Vigilância da Qualidade da Água para Consumo Humano (Information System for Surveillance of Water Quality for Human Consumption) that included all the Brazilian municipalities. Data criticism procedures were performed with the aid of R software. Filters were applied to remove municipalities with less than four months of records (1), and records with null values (2) and outliers (3). Municipalities were classified regarding the presence of valid information and fluoridation quality according to macro-region, federation units, and population size, presenting the roadmap at each step. RESULTS Approximately 134,000 records were reviewed. Of the Brazilian municipalities, 39% had data on the fluoride parameter, and only 33.3% had four months or more of information frequency. After applying filters, 1,810 (32.5%) municipalities had valid information for the fluoride parameter, with substantial variation between the South (83.6%) and North (0.7%) macro-regions. Of these, 726 (40.1%) showed very good fluoridation quality, determined by 80% or more records within the optimal concentration interval for prevention of dental caries, with higher value (54.3%) in municipalities with 50,000 inhabitants or more, and lower (34.2%) in those with less than 10,000 inhabitants. CONCLUSIONS Important differences persist within and between the Brazilian macro-regions regarding both the availability of information on the parameter, and the quality of water fluoridation in public supply systems in Brazil. The protocol for data review and processing with R software programming resources proved to be very useful for the production of information for decision-making based on a standardized method.