Resumo Neste artigo apresenta-se um estudo sobre construção de escalas, com base na Teoria da Resposta ao Item (TRI), para medir proficiência em conteúdos matemáticos básicos, necessários ao acompanhamento das disciplinas de Cálculo e similares, de ingressantes em cursos da área de Ciências Exatas. Adotou-se o modelo logístico unidimensional de três parâmetros, que estabelece média zero e desvio padrão 1, para as proficiências dos indivíduos. As proficiências estimadas foram transformadas em outra escala, optando-se por valores adotados por sistemas de avaliação brasileiros, a saber, 250 e 50. O instrumento de medida consistiu em uma prova com 36 itens, de cinco alternativas, somente uma correta, elaborados com base em uma matriz de referência, dividida em três temas, “Espaço e Forma”, “Grandezas e Medidas” e “Números e Operações, Álgebra e Funções”. Cada tema é composto por competências, que descrevem as habilidades que se deseja medir. Para a construção da escala foram especificados níveis de proficiência, representando pontos selecionados pelos pesquisadores para serem interpretados pedagogicamente. Estabelecidos os níveis âncora, foram definidos os itens âncora, a partir de critérios, como, por exemplo, o número de acertos, os percentuais de acertos e a diferença entre seus valores, para níveis consecutivos. Com base nestes critérios, comparou-se três métodos de posicionamento dos itens, mostrando as dificuldades de interpretação em pontos da escala. Tais dificuldades oportunizaram a propositura de outro método, segmentando a escala em faixas de proficiência, com base em agrupamentos hierárquicos dos níveis, o que permitiu a interpretação da escala em toda a sua amplitude.
Abstract This article presents a study on scale construction, based on the Item Response Theory (IRT), to measure the proficiency in basic mathematical contents, which are key to the follow-up of Calculus and similar subjects, for those entering courses in the Exact Sciences area. The one-dimensional logistic model with three parameters was adopted, which establishes zero as the mean and a standard deviation of 1, for individuals’ proficiencies. The estimated proficiencies were transformed in another scale, opting for values adopted by Brazilian evaluation systems: 250 and 50. The measurement instrument consisted of a test with 36 items, with five alternatives each, only one of them correct, that were elaborated based on a reference matrix, divided into three themes, “Space and Form”, “Quantities and Measures”, and “Numbers and Operations, Algebra and Functions”. Each subject is composed of competencies, which describe the skills to be measured. To build the scale, proficiency levels were specified, representing points selected by the researchers to be pedagogically interpreted. Once the anchor levels are established, anchor items were defined based on some criteria, such as the number of correct answers, the percentage of correct answers and the difference between their values, for consecutive levels. Based on these criteria, three methods of items’ positioning were compared, showing the difficulties of interpretation in points of the scale. Such difficulties made it possible to propose another method, segmenting the scale into ranges of proficiency, based on hierarchical groupings of levels, which allowed the scale to be interpreted in all its breadth.