Maneiras de calcular a variação

Autor: Robert Simon
Data De Criação: 21 Junho 2021
Data De Atualização: 1 Julho 2024
Anonim
[PASSO A PASSO] Como calcular velocidade média, tempo e distância
Vídeo: [PASSO A PASSO] Como calcular velocidade média, tempo e distância

Contente

A variância mede a dispersão do conjunto de dados. É muito útil na construção de modelos estatísticos: a baixa variação pode ser uma indicação de que você está descrevendo um erro ou ruído aleatório, em vez da relação subjacente nos dados. Com este artigo, o wikiHow ensina como calcular a variância.

Passos

Método 1 de 2: Calcule a variância de uma amostra

  1. Escreva seu conjunto de dados de amostra. Na maioria dos casos, os estatísticos só têm informações sobre uma amostra ou subconjunto da população que estão estudando. Por exemplo, em vez de fazer uma análise geral do "custo de cada carro na Alemanha", um estatístico pode encontrar o custo de uma amostra aleatória de alguns milhares de carros. Esse estatístico pode usar essa amostra para obter uma boa estimativa do custo de um carro na Alemanha. No entanto, é mais provável que não corresponda exatamente aos números reais.
    • Por exemplo: Ao analisar o número de muffins vendidos por dia em uma cafeteria, você pegou uma amostra aleatória de seis dias e obteve os seguintes resultados: 38, 37, 36, 28, 18, 14, 12, 11, 10,7, 9,9. Esta é uma amostra, não uma população, porque você não tem dados para todos os dias de abertura da loja.
    • E se cada Pontos de dados no mestre, vá para o método abaixo.

  2. Escreva a fórmula de variância da amostra. A variância de um conjunto de dados indica o grau de dispersão dos pontos de dados. Quanto mais próxima a variância estiver de zero, mais próximos os pontos de dados serão agrupados. Ao trabalhar com conjuntos de dados de amostra, use a seguinte fórmula para calcular a variação:
    • = /(n - 1)
    • é a variação. A variância é sempre calculada em unidades quadradas.
    • representa um valor em seu conjunto de dados.
    • ∑, que significa "soma", informa a você para calcular os parâmetros a seguir para cada valor e, em seguida, adicioná-los.
    • x̅ é a média da amostra.
    • n é o número de pontos de dados.

  3. Calcule a média da amostra. O símbolo x̅ ou "x-horizontal" é usado para indicar a média da amostra. Calcule como faria com qualquer média: some todos os pontos de dados e divida pelo número de pontos.
    • Por exemplo: Primeiro, some seus pontos de dados: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Em seguida, divida o resultado pelo número de pontos de dados, neste caso seis: 84 ÷ 6 = 14.
      Média da amostra = x̅ = 14.
    • Você pode pensar na média como o "ponto central" dos dados. Se os dados estiverem centrados na média, a variância é baixa. Se eles estão dispersos longe da média, a variância é alta.

  4. Subtraia a média de cada ponto de dados. Agora é a hora de calcular - x̅, onde cada ponto em seu conjunto de dados está. Cada resultado indicará o desvio da média de cada ponto correspondente, ou seja, a distância dele à média.
    • Por exemplo:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • É muito fácil verificar os seus cálculos, porque os resultados devem somar zero. Isto porque, pela definição da média, os resultados negativos (distância da média aos pequenos números resultados positivos (distância da média para números maiores) são completamente eliminados.
  5. Quadrar todos os resultados. Conforme observado acima, a lista de desvios atuais (- x̅) tem uma soma zero, o que significa que o "desvio médio" também será sempre zero e nada pode ser dito sobre a dispersão dos dados. Para resolver este problema, encontramos o quadrado de cada desvio. Graças a isso, todos são números positivos, valores negativos e valores positivos não se cancelam mais e dão a soma zero.
    • Por exemplo:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Agora você tem (- x̅) para cada ponto de dados na amostra.
  6. Encontre a soma dos valores quadrados. Agora é a hora de calcular todo o numerador da fórmula: ∑. O grande ciclo, ∑, requer que você adicione o seguinte valor de elemento para cada valor. Você calculou (- x̅) para cada valor na amostra, então tudo que você precisa fazer é apenas somar os resultados.
    • Por exemplo: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Divida por n - 1, onde n é o número de pontos de dados. Há muito tempo, ao calcular a variância da amostra, os estatísticos apenas dividiam por n. Essa divisão fornecerá a média do desvio quadrado, que corresponde exatamente à variância dessa amostra. No entanto, lembre-se de que a amostra é apenas uma estimativa de uma população maior. Se você pegar outra amostra aleatória e fizer o mesmo cálculo, obterá um resultado diferente. Acontece que dividir por n -1 em vez de n fornece uma estimativa melhor da variância de uma população maior - com a qual você realmente se importa. Essa correção é tão comum que agora é a definição aceita de variância da amostra.
    • Por exemplo: Existem seis pontos de dados na amostra, então n = 6.
      Variância da amostra = 33,2
  8. Compreenda a variância e o desvio padrão. Observe que, uma vez que há poderes na fórmula, a variância é medida no quadrado das unidades dos dados originais. Isso é visualmente confuso. Em vez disso, muitas vezes o desvio padrão é bastante útil. Mas não adianta perder nenhum esforço, porque o desvio padrão é determinado pela raiz quadrada da variância. É por isso que a variação da amostra é escrita em termos, e o desvio padrão de uma amostra é.
    • Por exemplo, o desvio padrão da amostra acima = s = √33,2 = 5,76.
    propaganda

Método 2 de 2: Calcular a variância de uma população

  1. Começando com o conjunto de dados mestre. O termo "população" é usado para se referir a todas as observações relevantes. Por exemplo, se você estiver pesquisando a idade dos residentes em Hanói, sua população geral incluirá as idades de todas as pessoas que vivem em Hanói. Normalmente, você criaria uma planilha para um grande conjunto de dados como este, mas aqui está um exemplo de conjunto de dados menor:
    • Por exemplo: Na sala de um aquário, existem exatamente seis aquários. Esses seis tanques contêm o seguinte número de peixes:





  2. Escreva a fórmula da variação geral. Visto que uma população contém todos os dados de que precisamos, essa fórmula nos dá a variação exata da população. Para distingui-la da variância da amostra (que é apenas uma estimativa), os estatísticos usam outras variáveis:
    • σ = /n
    • σ = variância da amostra. Esta é a salsicha normalmente quadrada. A variância é medida em unidades quadradas.
    • representa um elemento em seu conjunto de dados.
    • O elemento em ∑ é calculado para cada valor e depois adicionado.
    • µ é a média geral.
    • n é o número de pontos de dados na população.
  3. Encontre a média da população. Ao analisar uma população, o símbolo μ ("mu") representa a média aritmética. Para encontrar a média, some todos os pontos de dados e divida pelo número de pontos.
    • Você pode pensar em significa "médio", mas tenha cuidado, porque a palavra tem muitas definições matemáticas.
    • Por exemplo: valor médio = µ = = 10,5
  4. Subtraia a média de cada ponto de dados. Os pontos de dados mais próximos da média têm uma diferença mais próxima de zero. Repita o problema de subtração para todos os pontos de dados e provavelmente você começará a sentir a dispersão dos dados.
    • Por exemplo:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Quadrado cada sinal. Neste ponto, alguns dos resultados obtidos na etapa anterior serão negativos e alguns serão positivos.Se os dados forem visualizados em uma linha isométrica, esses dois itens representam os números à esquerda e à direita da média. Isso não teria utilidade no cálculo da variância, pois esses dois grupos se anulariam. Em vez disso, eleve ao quadrado todos para que sejam todos positivos.
    • Por exemplo:
      (- μ) para cada valor de Eu vai de 1 a 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Encontre a média de seus resultados. Agora você tem um valor para cada ponto de dados, relacionado (não diretamente) a quão longe esse ponto de dados está da média. Faça a média somando-os e dividindo pelo número de valores que você tem.
    • Por exemplo:
      Variância geral = 24,25
  7. Receita de contato. Se você não tiver certeza de como isso se encaixa na fórmula descrita no início do método, escreva todo o problema à mão, e não abrevie:
    • Depois de encontrar a diferença da média e quadrá-la, você obtém (- µ), (- µ) e assim por diante até (- µ), onde é o último ponto de dados. no conjunto de dados.
    • Para encontrar a média desses valores, some-os e divida por n: ((- μ) + (- μ) + ... + (- μ)) / n
    • Depois de reescrever o numerador com notação sigmóide, você tem /n, variância da fórmula.
    propaganda

Adendo

  • Como a variância é difícil de interpretar, esse valor geralmente é calculado como o ponto de partida para encontrar o desvio padrão.
  • Usar "n-1" em vez de "n" no denominador ao analisar a amostra é uma técnica conhecida como correção de Bessel. A amostra é apenas uma estimativa de uma população completa, e a média da amostra tem um certo viés para corresponder a essa estimativa. Essa correção elimina o viés acima. Trata-se do fato de que uma vez que n - 1 pontos de dados foram enumerados, o último ponto n foi uma constante, porque apenas determinados valores foram usados ​​para calcular a média da amostra (x̅) na fórmula de variância.