Como avaliar a significância estatística

Autor: Randy Alexander
Data De Criação: 2 Abril 2021
Data De Atualização: 26 Junho 2024
Anonim
Como avaliar a significância estatística - Dicas
Como avaliar a significância estatística - Dicas

Contente

O teste de hipóteses é orientado por análise estatística. A confiança estatisticamente significativa é calculada usando o valor p - que indica a probabilidade de um resultado observado quando uma determinada proposição (a hipótese nula) é verdadeira. Se o valor p for menor que o nível de significância (geralmente 0,05), o experimentador pode concluir que há evidências suficientes para refutar a hipótese nula e admitir a hipótese inversa. Usando um teste t simples, você pode calcular o valor p e determinar a significância entre dois grupos diferentes de dados.

Passos

Parte 1 de 3: configure seus experimentos

  1. Determine sua hipótese. O primeiro passo para avaliar a significância estatística é identificar as perguntas a serem respondidas e declarar sua hipótese. Hipótese é uma afirmação dos dados empíricos e possíveis discrepâncias na população. Todo experimento tem uma hipótese nula e uma hipótese inversa. Em geral, você comparará dois grupos para ver se eles são iguais ou diferentes.
    • Em geral, a hipótese não é (H0) confirmam que não há diferença entre os dois grupos de dados. Exemplo: Alunos que leem o material antes da aula não obtêm melhores notas finais.
    • A hipótese inversa (Huma) é contrário à hipótese nula e é uma afirmação que você está tentando apoiar com seus dados empíricos. Por exemplo: os alunos que leem o material antes da aula, na verdade, obtêm melhores notas finais.

  2. Selecione o nível de significância para determinar o grau de diferença que pode ser visto como significativo nos dados. O nível de significância (também conhecido como alfa) é o limite que você escolhe para determinar o significado. Se o valor de p for menor ou igual a um determinado nível de significância, os dados são considerados estatisticamente significativos.
    • Como regra geral, o nível de significância (ou alfa) é geralmente escolhido no nível 0,05 - o que significa que a chance de observar a diferença vista nos dados é aleatória de apenas 5%.
    • Quanto maior o nível de confiança (e, portanto, quanto menor o valor p), mais significativos são os resultados.
    • Se for necessária mais confiança, diminua o valor de p para 0,01. Um valor p baixo é frequentemente usado na fabricação para detectar defeitos do produto. Um alto grau de confiabilidade é fundamental para aceitar que cada peça funcionará como deveria ser.
    • Para a maioria dos experimentos baseados em hipóteses, um nível de significância de 0,05 é aceitável.

  3. Decida se usará um teste unilateral ou bicaudal. Uma das suposições do teste t é que seus dados estão em uma distribuição normal. A distribuição normal formará uma curva em sino com a maioria das observações centralizadas. O teste t é um teste matemático que verifica se os seus dados estão fora da distribuição normal, acima ou abaixo, na parte “superior” da curva.
    • Se você não tiver certeza se os dados estão acima ou abaixo do grupo de controle, use um teste bicaudal. Ele permite que você verifique a importância em ambas as direções.
    • Se você sabe qual é a direção esperada de seus dados, use um teste unilateral. No exemplo acima, você espera que a pontuação do aluno melhore. Portanto, você usa o teste unilateral.

  4. Determine o tamanho da amostra com análise de força. A força de um teste é a capacidade de observar o resultado esperado com um determinado tamanho de amostra. O limite comum para força (ou β) é 80%. A análise de força pode ser bastante complicada sem alguns dados preliminares porque você precisa de algumas informações sobre a média esperada entre os grupos e seus desvios padrão. Use a análise de força online para determinar o tamanho de amostra ideal para seus dados.
    • Os pesquisadores geralmente realizam um pequeno estudo de premissa para informar a análise de força e decidir o tamanho da amostra necessária para um estudo amplo e abrangente.
    • Se não houver meios para fazer pesquisas complexas de premissas, estime a média possível com base na leitura de artigos e pesquisas que outros indivíduos possam ter feito. Pode ser um bom começo para determinar os tamanhos das amostras.
    propaganda

Parte 2 de 3: Calcule o desvio padrão

  1. Determine a fórmula do desvio padrão. O desvio padrão mede a dispersão dos dados. Fornece informações sobre a identidade de cada ponto de dados na amostra. Ao começar, as equações podem parecer bastante complicadas. No entanto, as etapas abaixo o ajudarão a compreender facilmente o processo de cálculo. A fórmula é s = √∑ ((xEu - µ) / (N - 1)).
    • s é o desvio padrão.
    • ∑ indica que você terá que somar todas as observações coletadas.
    • xEu cada um representa o valor dos seus dados.
    • µ é a média dos dados para cada grupo.
    • N é o número total de observações.
  2. Faça a média do número de observações em cada grupo. Para calcular o desvio padrão, você primeiro precisa calcular a média das observações para cada grupo individual. Este valor é simbolizado pela letra grega mu ou µ. Para fazer isso, basta adicionar as observações e dividir pelo número total de observações.
    • Por exemplo, para encontrar a pontuação média do grupo que lê o documento antes da aula, vejamos alguns dados. Para simplificar, usaremos um conjunto de dados de 5 pontos: 90, 91, 85, 83 e 94 (em uma escala de 100 pontos).
    • Some todas as observações: 90 + 91 + 85 + 83 + 94 = 443.
    • Divida a soma acima pelo número de observações N (N = 5): 443/5 = 88,6.
    • A pontuação média desse grupo é 88,6.
  3. Subtraia a média de cada valor observado. A próxima etapa envolve a parte (xEu - µ) da equação. Subtraia o valor médio de cada valor observado. Com o exemplo acima, temos cinco subtrações.
    • (90 - 88,6), (91- 88,6), (85 - 88,6), (83 - 88,6) e (94 - 88,6).
    • O valor calculado é 1,4; 2,4; -3,6; -5,6 e 5,4.
  4. Quadrar as diferenças acima e somá-las. Cada novo valor calculado será agora elevado ao quadrado. Aqui, o sinal negativo também será removido. Se um sinal negativo aparecer após esta etapa ou no final do cálculo, você pode ter esquecido de fazer a etapa acima.
    • Em nosso exemplo, trabalharemos agora com 1,96; 5,76; 12,96; 31,36 e 29,16.
    • Some esses quadrados: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Divida pelo número total de observações menos 1. A divisão por N - 1 ajuda a compensar um cálculo que não é executado na população como um todo, mas é baseado em uma amostra de todos os alunos.
    • Subtrair: N - 1 = 5 - 1 = 4
    • Divide: 81,2 / 4 = 20,3
  6. Obtenha a raiz quadrada. Depois de dividido pelo número de observações menos 1, tire a raiz quadrada do valor obtido. Esta é a última etapa do cálculo do desvio padrão. Alguns programas estatísticos o ajudarão a realizar este cálculo após a importação dos dados originais.
    • Com o exemplo acima, o desvio padrão da nota de final do semestre dos alunos que lêem o documento antes da aula é: s = √20,3 = 4,51.
    propaganda

Parte 3 de 3: Determinação da significância estatística

  1. Calcule a variação entre seus dois grupos de observações. Até este ponto, o exemplo tratou apenas de um grupo de observações. Para comparar dois grupos, você obviamente precisa de dados de ambos. Calcule o desvio padrão do segundo grupo de observações e use-o para calcular a variância entre os dois grupos experimentais. A fórmula para calcular a variância é: sd = √ ((s1/ N1) + (s2/ N2)).
    • Sd é a variação entre os grupos.
    • S1 é o desvio padrão dos grupos 1 e N1 é o tamanho do grupo 1.
    • S2 é o desvio padrão dos grupos 2 e N2 é o tamanho do grupo 2.
    • Em nosso exemplo, digamos que os dados do grupo 2 (alunos que não leram o texto antes da aula) tenham tamanho 5 e desvio padrão de 5,81. A variação é:
      • Sd = √ ((s1) / N1) + ((s2) / N2))
      • Sd = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Calcule o t-score dos dados. As estatísticas T permitem que você converta os dados em uma forma comparável a outros dados. O valor t também permite que você execute um teste t, um teste que permite calcular a probabilidade de uma diferença estatisticamente significativa entre os dois grupos. A fórmula para calcular a estatística t é: t = (µ1 – µ2) / Sd.
    • µ1 é a média do primeiro grupo.
    • µ2 é a média do segundo grupo.
    • Sd é a variação entre as observações.
    • Use a maior média como µ1 para não obter uma estatística t negativa.
    • Para nosso exemplo, suponha que a média observada para o grupo 2 (que não leu o artigo anterior) seja 80. O t-score é: t = (µ1 – µ2) / Sd = (88,6 – 80)/3,29 = 2,61.
  3. Determine o grau de liberdade da amostra. Ao usar a estatística t, os graus de liberdade são determinados com base no tamanho da amostra. Some o número de observações para cada grupo e subtraia dois. No exemplo acima, o grau de liberdade (d.f.) é 8 porque há 5 observações no primeiro grupo e 5 amostras no segundo grupo ((5 + 5) - 2 = 8).
  4. Use a tabela t para avaliar a significância. As tabelas de valores t e graus de liberdade podem ser encontradas em um livro de estatísticas padrão ou online. Encontre a linha que contém os graus de liberdade dos dados e o valor p que corresponde à estatística t que você tem.
    • Com graus de liberdade 8 e t = 2,61, o valor p para um teste unicaudal varia entre 0,01 e 0,025. Como o nível de significância escolhido é menor ou igual a 0,05, nossos dados são estatisticamente significativos. Com esses dados, rejeitamos a hipótese nula e aceitamos a hipótese inversa: alunos que leem a matéria antes das aulas têm notas finais mais altas.
  5. Considere conduzir mais pesquisas. Muitos pesquisadores realizam estudos de premissas com alguma medida para entender como projetar um estudo maior. Fazer outras pesquisas com mais métricas aumentará sua confiança em suas conclusões. propaganda

Adendo

  • A estatística é um campo amplo e complexo. Faça um curso de teste de hipótese estatística no ensino médio ou na universidade (ou superior) para entender a significância estatística.

Atenção

  • Esta análise se concentra no teste t para verificar a diferença entre as duas populações de distribuição normal. Dependendo da complexidade dos dados, você pode precisar de outro teste estatístico.