Estatística Multivariada

Hair et al. (2009) apresenta a estatística multivariada como o conjunto de ferramentas que auxiliam na formulação de questões complexas de maneira relativamente específica e precisa tornando possível a condução da análise de uma grande quantidade de dados. As técnicas são ditas multivariadas quando as variáveis estudadas são aleatórias e inter-relacionadas. Técnicas univariadas para este tipo de dados trariam interpretações errôneas devido a dependência entre as variáveis. Em muitos casos este é justamente um dos principais objetivos da estatística multivariada que é prever o grau de relacionamento entre as variáveis.

A Estatística Multivariada compõe um conjunto de técnicas que buscam aferir a correlação entre variáveis sendo elas métricas ou não métricas. Deste modo facilitando o entendimento e a interpretação dos fenômenos envolvidos descritos por um conjunto de dados composto por variáveis aleatórias e correlacionadas. Mingoti (2005) apresenta as técnicas de estatística multivariada pertencendo a dois grandes grupos:

  1. Técnicas exploratórias de sintetização da estrutura de variedade de dados.
Ex: Análise dos Componentes Principais, Análise Fatorial, Análise de Correlação Canônica, Análise de Agrupamento, Análise Discriminante e Análise de Correspondência;
  1. Técnicas de inferência estatística;
Ex: Método de Estimação de parâmetros, teste de hipóteses, análise de variância, de covariância e de regressão multivariada;

Johnson and Wichern (1998) justificam a aplicação de técnicas de estatística multivariada devido à complexidade dos fenômenos que exigem a observação de diversas variáveis. Ou seja, o estudo de muitos fenômenos exigem o entendimento da relação entre diversas variáveis trazendo uma dificuldade inerente do processo.

Frente a uma coleção de técnicas propostas pela literatura que compõem o arcabouço da estatística multivariada torna-se imprescindível alcançar três objetivos (Rencher, 2002), a saber:

  1. Obter uma compreensão completa e cada técnica de análise multivariada, os seus propósitos, pressupostos e limitações;
  2. Selecionar uma ou mais técnicas apropriada de um conjunto reconhecendo a natureza dos dados abrindo caminho para uma análise significativa;
  3. Ser capaz de interpretar os resultados de uma análise de computador de um conjunto de dados multivariados;

Johnson and Wichern (1998) afirma que as técnicas de estatística multivariada são geralmente utilizadas para:

  • Redução e simplificação de dados;

Ex: usando diversas variáveis relacionadas com a resposta dos pacientes com câncer busca-se construir uma simples medida de resposta a partir de um conjunto reduzido de variáveis;

  • Ordenação e agrupamento de dados;

Ex: dados de resposta relacionados com estímulos visuais são usados para estabelecer regras para a separação de indivíduos que sofrem de esclerose múltipla;

  • Investigação de dependência entre as variáveis;

Ex: selecionar variáveis que servem para identificar os fatores que contribuem para a contratação de um serviço;

  • Predição;

Ex: Associação entre a pontuação obtida em diversas avaliações de diversas alunos de diversas instituições de modo a prever o sucesso ou não na universidade;

  • Teste de Hipóteses;

Ex: Conjunto de dados experimental consistindo de várias variáveis é usado para aferir se haverá um risco ambiental;

Ficou interessado em conhecer mais sobre a Estatística Multivariada? Logo logo postarei vídeos das principais técnicas de multivariada (Análise de Componentes Principais, Análise Fatorial, Cluster, Análise discriminante, Análise dos Componentes Canônicos e Permanova) utilizando o software R neste site! Conto com o apoio de todos.

abraço!

Dr. João Igor Leitão – 85999695963

i_leitao@hotmail.com

Pin It on Pinterest