Este site utiliza cookies

Salvamos dados da sua visita para melhorar nossos serviços e personalizar sua experiência. Ao continuar, você concorda com nossa Política de Privacidade, incluindo a política de cookie.

Novo RLI
x
ExitBanner
Genética

O que são e para que servem as análises de agrupamento?

O que são e para que servem as análises de agrupamento?

Texto: Manuela Gama

 A análise de agrupamento tem a finalidade de aglomerar os animais em grupos a partir de suas semelhanças. Os grupos que serão formados servem para facilitar o manejo dos animais, assim como direcionar os programas de melhoramento genético.

Captura de tela 2016-09-26 a?s 10.46.06.png (946 KB) 

A coleta de dados é um dos passos mais importante de qualquer procedimento para se estudar a situação de um rebanho e planejar as próximas ações, inclusive para a realização de avaliações genéticas. Coletar a maior quantidade de informações de diversas características, de forma correta, fidedigna e regular é a melhor forma de conhecer seu rebanho e se preparar para melhorá-lo. Sabendo onde queremos chegar, a determinação do caminho a percorrer somente será possível se soubermos que material genético temos nas mãos.

Por isso, é recomendado coletar informações e avaliarmos mais de uma característica nos animais, como por exemplo a sua produção de leite, a persistência da lactação, produção no pico de lactação, produção no primeiro terço da lactação, no segundo e no terceiro terço, etc. Porém, quanto mais informações, mais complexa é a sua interpretação.

Do ponto da operação na propriedade, o conhecimento de quanto e como nossos animais produzem, auxilia na organização em grupos para facilitar e otimizar o manejo. Se as características são muitas e suas interpretações são extensas, então, como podemos simplificá-las sem perder informações importantes do nosso banco de dados?

Uma forma de estudar as várias características é por meio de estatística multivariada, que nada mais é que um conjunto de métodos que permite a análise simultânea de múltiplas medidas de cada indivíduo. Elas permitem a simplificação estrutural, ordenação, agrupamento e a investigação da dependência entre as variáveis que serão estudadas.

Esse conjunto de técnicas exploratórias simplificam a estrutura da variabilidade que ocorre nos dados e, assim, o estudo pode ser realizado com diversas variáveis. Algumas metodologias que podem ser utilizadas são: a análise de componentes principais, a análise de agrupamento, a análise discriminante, entre outras.

 

Grupos de semelhantes

Dando ênfase na análise de cluster ou também chamada de agrupamento, ela recebe esse nome por ter a finalidade de aglomerar os animais em grupos a partir das suas semelhanças. Nesses agrupamentos, busca-se a maior semelhança (homogeneidade) entre os indivíduos dentro de um grupo, e a maior heterogeneidade entre os animais de grupos distintos.

Esses grupos que serão formados podem ser a partir de medidas de desempenho, e servem para programar e facilitar o manejo dos animais.

Do ponto de vista do melhoramento genético, os agrupamentos podem ser feitos a partir dos valores genéticos estimados para as várias características estudadas. Assim, é possível obter um grupo com os melhores animais (animais com os maiores valores genéticos) para o maior número de variáveis. Assim como teremos um grupo com os animais que apresentam os menores valores genéticos para as variáveis estudadas.

Mas para chegar nesses grupos formados, há uma importante etapa das análises que seria a escolha do critério que meça a distância ou a diferença entre os animais, ou que meça a semelhança entre eles. No Melhoramento Genético, normalmente usa-se a distância ou dissimilaridade entre os animais medidos.

A análise de cluster pode ser realizada pelo método hierárquico ou pelo não-hierárquico. No primeiro caso, não há uma predeterminação de quantos grupos serão formados ao final. Já na não-hierárquica, pode-se terminar quantos grupos quero ter ao final das análises.

O que isso quer dizer? Quer dizer que, quando estou começando a conhecer meus dados, não é possível identificar com clareza a distribuição dos valores genéticos, por exemplo, no caso de uma avaliação genética. Nesse caso, utiliza-se o método hierárquico para visualizar na forma de um gráfico, denominado dendograma, a proximidade ou não entre os indivíduos, como apresentado na Figura 1. 

Captura de tela 2016-09-26 a?s 10.46.24.png (48 KB)

No dendograma estão dispostas linhas ligadas segundo os níveis de similaridade que agruparam pares de variáveis. Isso é feito da seguinte maneira: a análise começa com um animal por grupo, tendo um total de grupos igual ao número de animais estudados. Conforme as análises mostram que os animais são próximos, uma linha é usada para uni-los. E assim vai seguindo até que haja um grupo contendo todos os animais.

Depois de visualizar o dendograma da Figura 1, é possível determinar uma quantidade de grupos de indivíduos semelhantes entre si, e distantes entre grupos. No exemplo apresentado, podemos inferir que 2 grupos são facilmente visualizados (A e B).

Após identificarmos 2 grupos no dendograma, uma segunda análise pode ser realizada, determinando que os animais sejam separados nesses 2 grupos; essa análise é chamada de não-hierárquica. Nesse exemplo, 2 grupos serão formados. A distribuição final pode ser facilmente vista por um gráfico gerado pelo programa utilizado (Gráfico 1).

Captura de tela 2016-09-26 a?s 10.46.28.png (25 KB) 

No eixo horizontal estão representadas as características estudadas, e no vertical, estão os valores genéticos padronizados, para que características com medidas de magnitude muito diferentes, possam ser comparadas.

Observa-se nesse exemplo, que o grupo 1 apresenta os animais com os valores genéticos mais elevados para todas as caraterísticas estudadas. (Este exemplo é fictício, por isso não foram especificadas as características analisadas, mas poderiam ser: produção acumulada aos 305 dias, persistência, produção ao pico, duração da lactação, produção de sólidos, etc.).

 

Ferramenta de manejo

Nos resultados das análises, neste caso realizadas no programa estatístico (SAS®), uma planilha contendo os animais de cada grupo é gerada, separando os animais para os seus respectivos grupos.

No caso de manejo, os animais podem ser apartados para os lotes adequados. No caso do melhoramento genético, já é possível identificar os animais que devem ser utilizados para o melhoramento simultâneo do conjunto de características estudadas. É válido ressaltar que quanto mais correlacionadas às características estudadas, mais fácil é a seleção, pois selecionando para uma, já estamos selecionando para a outra também.

As análises de cluster podem ser realizadas em qualquer propriedade que possua a coleta de informações, assim como outras inúmeras análises que têm por objetivo auxiliar o produtor a melhorar o desempenho do seu rebanho.

 

 

Compartilhar:


Comentários

Enviar comentário


Artigos Relacionados