RESUMO O conhecimento da variação fenotípica do germoplasma de mandioca (Manihot esculenta Crantz) permite estimar a variabilidade genética como suporte para seleção de genitores contrastantes. O objetivo deste trabalho foi definir grupos homogêneos de germoplasma de mandioca com base em características produtivas, resistência a doenças e qualidade de raízes utilizando o método não-hierárquico K-means. Os valores genotípicos estimados pelo BLUP (Best Linear Unbiased Predictor) foram utilizados para a análise de agrupamento. O número de grupos foi definido no início da estabilização da menor soma de quadrados dentro dos grupos. Foram obtidos 17 grupos para representar a diversidade do germoplasma, cujo número de acessos variou de 7 (Grupo 15) a 69 (Grupo 9). Em geral, os acessos pertencentes aos grupos 1; 4; 7; 12; 15 e 16, apresentaram boas características agronômicas, tais como alta produtividade de raízes frescas e de amido (> 60,7 t ha-1 e 18,6 t ha-1, respectivamente). Por outro lado, apenas o grupo 15 apresentou menor severidade de bacteriose. Os grupos obtidos apresentaram grandes diferenças entre si, conforme valores da soma de quadrados dentro dos grupos, que variavam entre 215,1 (Grupo 15) a 2338,3 (Grupo 8). O K-means permitiu a formação de grupos consistentes com base nas características agronômicas avaliadas. Portanto, o algoritmo K-means foi eficiente para a formação de grupos homogêneos com baixa variação genotípica dentro, especialmente para análises de grandes quantidades de dados, como em bancos de germoplasma de mandioca.
ABSTRACT The knowledge of the phenotypic variation of cassava (Manihot esculenta Crantz) germplasm allows the estimative of the genetic variability to support the selection of contrasting genitors. Therefore, the aim of this work was to define homogeneous groups of cassava germplasm based on yield traits, disease resistance and root quality using K-means as a non-hierarchical method. Breeding values estimated by Best Linear Unbiased Predictor (BLUP) were used for the cluster analysis. The number of groups was defined according to the stabilization of the smallest within-group sum of squares. Seventeen clusters were defined to represent the diversity of the germplasm, whose number of accessions ranged from 7 (Group 15) to 69 (Group 9). In general, accessions belonging to Groups 1, 4, 7, 12, 15 and 16 showed good agronomic traits, such as high fresh root yield and starch yield (> 60.7 t ha-1 and 18.6 t ha-1, respectively). In contrast, only Group 15 presented low bacterial blight severity. The groups obtained showed strong differences, as evidenced by the within-groups sums of squares values, which ranged from 215.1 (Group 15) to 2,338.3 (Group 8). The K-means algorithm allowed the formation of consistent groups based on yield traits, disease resistance and root quality. Therefore, the K-means algorithm was efficient in the formation of groups with low within genotypic variation, especially concerning large amounts of data, such as in cassava germplasm banks.