RESUMO Objetivou-se com este estudo identificar, por meio da análise de componentes principais e análise de agrupamento, as variáveis capazes de explicar a variabilidade na qualidade e na produção de leite de vacas Holandesas. Foram utilizados dados mensais de controle leiteiro, de três fazendas comerciais localizadas na região Agreste do estado de Pernambuco, Brasil, obtidos no período de 2007 a 2017. Foram analisadas 5.872 informações de produção e componentes do leite, e de escore de células somáticas (SCS), quanto à possibilidade de formação de grupos que pudessem ser destacados pela similaridade e verificar a capacidade discriminante dessas características nos grupos. Os métodos K-means e Ward.D2, baseados na análise da distância euclidiana e dos componentes principais (PCA), foram utilizados para indicar as fontes de variação que diferenciaram os grupos. Foi observado que os primeiros três componentes principais explicaram 79,69% da variabilidade dos dados. A variável que mais contribuiu no primeiro componente foi o teor de sólidos totais com 29,66%. No segundo componente, a lactose, se destacou com uma contribuição de 49,43%. Na análise de agrupamento, três clusters diferiram em relação a todas as características (p<0,001), o cluster 2, por exemplo, concentrou 43,15% (2.534) das informações, agrupando animais com um menor SCS e maior lactose e produção de leite. As variáveis sólidos totais, lactose e gordura foram as que mais contribuíram dentro dos três componentes selecionados. A ACP e agrupamento podem ser ferramentas úteis na obtenção de características efetivas, sendo três fatores considerados importantes para explicar a relação entre produção e qualidade do leite.
ABSTRACT Using multivariate analyses, this study attempted to identify important traits explaining the relationship between milk production and quality produced by Holstein cows. Monthly milk records from three commercial dairy farms located in the Agreste region of Pernambuco, Brazil, collected in the period from 2007 to 2017, were used. A total of 5,872 observations regarding milk production, milk components and somatic cell score (SCS) were analyzed using principal component analysis (PCA) and cluster analysis. According to the former analysis, the first three principal components explained 79.69% of the total variation. Total solids content contributed 29.66% of the variation in the first principal component, while lactose content contributed 49.43% of the variation in the second principal component. According to the latter analysis, three clusters differed for all characteristics (p<0.001) and cluster 2 concentrated 43.15% (2,534) of the information with lower SCS and higher lactose content and milk production. Total solids, lactose and fat were considered the most representative traits explaining the variability of the data set. The multivariate techniques used in this study proved useful in obtaining effective characteristics, with three factors considered important in explaining the relationship between Holstein cows’ milk production and quality.