RESUMO A investigação da multicolinearidade permite que parâmetros em análises multivariadas sejam estimados com maior precisão e com interpretação biológica. Para ter confiabilidade nas estimativas do grau de multicolinearidade, é necessário utilizar adequado tamanho de amostra. Assim, os objetivos deste trabalho foram determinar o tamanho de amostra (número de plantas) necessário para a estimação dos indicadores do grau de multicolinearidade - número de condição (NC), determinante da matriz de correlação (DET) e fator de inflação da variância (FIV) -em caracteres morfológicos de centeio e verificar a variabilidade do tamanho de amostra entre os indicadores. Foram conduzidos cinco e três ensaios de uniformidade com as cultivares BRS Progresso e Temprano, respectivamente. Foram avaliados oito caracteres morfológicos em 780 plantas em oito ensaios. Para cada ensaio, foram selecionados 22 casos entre os 28 formados pela combinação de oito caracteres, tomados seis a seis, totalizando 176 casos. Para cada caso, foram planejados 197 tamanhos de amostra (20, 25, 30, ..., 1.000 plantas) e para cada tamanho foram realizadas 2.000 reamostragens, com reposição, determinados o NC, DET e FIV e calculada a média das 2.000 estimativas. Após, para cada caso e indicador, foi determinado o tamanho de amostra, por meio de três modelos: método da máxima curvatura modificado e modelos linear e quadrático segmentados com resposta em platô. Há variabilidade entre os tamanhos de amostra entre os indicadores, com necessidade de maiores tamanhos de amostra para DET, seguido de NC e FIV, nessa ordem, com no mínimo de 180, 116 e 85 plantas, respectivamente. biológica Assim , (NC) (DET (FIV Temprano respectivamente 78 ensaio 2 17 19 20, 20 (20 25 30 ... 1000 1 000 1.00 2000 2.00 reamostragens reposição Após indicador platô ordem 180 11 8 (NC 7 (2 3 .. 100 00 1.0 200 2.0 18 ( . 10 0 1. 2.
ABSTRACT Investigation of multicollinearity allows parameters in multivariate analysis to be estimated with higher precision and with biological interpretation. In order to generate reliable estimates of the degree of multicollinearity, it is necessary to use appropriate sample size. Thus, the objectives of this study were to determine the sample size (number of plants) necessary to estimate the indicators of the degree of multicollinearity - condition number (CN), correlation matrix determinant (DET), and variance inflation factor (VIF) - in morphological traits of rye and to verify the variability of the sample size between the indicators. Five and three uniformity trials were conducted with the cultivars BRS Progresso and Temprano, respectively. Eight morphological traits were evaluated in 780 plants in eight trials. For each trial, 22 cases were selected among the 28 formed by the combination of eight traits, taken six by six, totaling 176 cases. In each case, 197 sample sizes were planned (20, 25, 30, ..., 1,000 plants) and in each size 2,000 resampling procedures with replacement were performed, CN, DET, and VIF were determined and the average among 2,000 estimates was calculated. For each case and indicator (CN, DET, and VIF), the sample size was determined through three models: modified maximum curvature method and linear and quadratic segmented models with plateau response. There is variability between sample sizes between indicators, with larger sample sizes required for DET, followed by CN and VIF, in that order, with at least 180, 116 and 85 plants, respectively. interpretation Thus , (CN) DET (DET) (VIF Temprano respectively 78 trial 2 17 19 20, 20 (20 25 30 ... 1000 1 000 1,00 2000 2,00 performed calculated (CN VIF) response 180 11 8 (DET 7 (2 3 .. 100 00 1,0 200 2,0 18 ( . 10 0 1, 2,