Resumo As reformas educativas implantadas nas últimas décadas caracterizam-se, entre outros traços, pela utilização de avaliações em larga escala como instrumento de gestão de redes de ensino e de responsabilização de profissionais da educação. Isso tem ocorrido de modo peculiar em cada país e, no Brasil, observa-se a difusão dessas avaliações, por meio de provas padronizadas. Tais avaliações geram na comunidade acadêmica e educacional um debate no qual há posições que vão da contraposição extremada ao reconhecimento da contribuição das avaliações em larga escala e das medidas educacionais como norteadoras de políticas e programas educacionais, incluindo as restrições ao uso que vem sendo feito de seus resultados. Diante dos argumentos favoráveis e contrários, incluindo as dimensões técnicas e políticas, neste trabalho, apresenta-se uma reflexão que reconhece a utilidade dessas avaliações, ainda que questionando alguns de seus usos para a gestão como critério, por exemplo, para a alocação de recursos nas escolas com melhores resultados, a definição de bônus para professores, o estabelecimento de rankings estimulando a competição entre escolas e redes de ensino, e seu entendimento como indicador único e principal de qualidade de ensino. Assim, o objetivo deste artigo é discutir as principais críticas e ponderações às avaliações em larga escala presentes na literatura nacional e internacional e sistematizar o debate em torno de suas potencialidades. Para tanto, dois aspectos recorrentes na literatura foram destacados, o papel e a validade das avaliações em larga escala nas reformas educacionais e o uso de seus resultados para a gestão de sistemas e escolas.
Abstract Educational reforms in recent decades have been characterized, among other features, by the use of large-scale assessments as a management tool of school systems and of educator accountability. This phenomenum has occurred differently in each country. In Brazil there has been widespread use such assessments with standardized tests, which generates in the academic and educational community not consensus but a debate in which there are different positions, ranging from the extreme opposition to the recognition of the contribution of large-scale assessments and educational measures to guide educational policies and programs, including restrictions on the use made of their results. Considering positive and negative arguments, including technical and political dimensions, this article, on the one hand, presents a reflection that recognizes the usefulness of these evaluations, and, on the other, questions some of its uses for educational management, for example, allocating resources in schools with best results, setting bonuses for teachers, establishing rankings which stimulate competition between schools and school systems, and understanding test results as a unique and primary indicator of education quality. The objective of this article is to discuss the main pros and cons to large-scale assessments in the national and international literature and systematize the debate on their potential. For this, it focuses on two recurrent themes in literature: the role and validity of large-scale assessments in the education reforms and the use of their results for the management of educational systems and schools.