Hair et al. (2009) apresenta a estatística multivariada como o conjunto de ferramentas que auxiliam na formulação de questões complexas de maneira relativamente específica e precisa tornando possível a condução da análise de uma grande quantidade de dados. As técnicas são ditas multivariadas quando as variáveis estudadas são aleatórias e inter-relacionadas. Técnicas univariadas para este tipo de dados trariam interpretações errôneas devido a dependência entre as variáveis. Em muitos casos este é justamente um dos principais objetivos da estatística multivariada que é prever o grau de relacionamento entre as variáveis.
A Estatística Multivariada compõe um conjunto de técnicas que buscam aferir a correlação entre variáveis sendo elas métricas ou não métricas. Deste modo facilitando o entendimento e a interpretação dos fenômenos envolvidos descritos por um conjunto de dados composto por variáveis aleatórias e correlacionadas. Mingoti (2005) apresenta as técnicas de estatística multivariada pertencendo a dois grandes grupos:
- Técnicas exploratórias de sintetização da estrutura de variedade de dados.
- Técnicas de inferência estatística;
Johnson and Wichern (1998) justificam a aplicação de técnicas de estatística multivariada devido à complexidade dos fenômenos que exigem a observação de diversas variáveis. Ou seja, o estudo de muitos fenômenos exigem o entendimento da relação entre diversas variáveis trazendo uma dificuldade inerente do processo.
Frente a uma coleção de técnicas propostas pela literatura que compõem o arcabouço da estatística multivariada torna-se imprescindível alcançar três objetivos (Rencher, 2002), a saber:
- Obter uma compreensão completa e cada técnica de análise multivariada, os seus propósitos, pressupostos e limitações;
- Selecionar uma ou mais técnicas apropriada de um conjunto reconhecendo a natureza dos dados abrindo caminho para uma análise significativa;
- Ser capaz de interpretar os resultados de uma análise de computador de um conjunto de dados multivariados;
Johnson and Wichern (1998) afirma que as técnicas de estatística multivariada são geralmente utilizadas para:
- Redução e simplificação de dados;
Ex: usando diversas variáveis relacionadas com a resposta dos pacientes com câncer busca-se construir uma simples medida de resposta a partir de um conjunto reduzido de variáveis;
- Ordenação e agrupamento de dados;
Ex: dados de resposta relacionados com estímulos visuais são usados para estabelecer regras para a separação de indivíduos que sofrem de esclerose múltipla;
- Investigação de dependência entre as variáveis;
Ex: selecionar variáveis que servem para identificar os fatores que contribuem para a contratação de um serviço;
- Predição;
Ex: Associação entre a pontuação obtida em diversas avaliações de diversas alunos de diversas instituições de modo a prever o sucesso ou não na universidade;
- Teste de Hipóteses;
Ex: Conjunto de dados experimental consistindo de várias variáveis é usado para aferir se haverá um risco ambiental;
Ficou interessado em conhecer mais sobre a Estatística Multivariada? Logo logo postarei vídeos das principais técnicas de multivariada (Análise de Componentes Principais, Análise Fatorial, Cluster, Análise discriminante, Análise dos Componentes Canônicos e Permanova) utilizando o software R neste site! Conto com o apoio de todos.
abraço!
Dr. João Igor Leitão – 85999695963
i_leitao@hotmail.com
Seja o primeiro a comentar