Calcular covariância

Autor: Judy Howell
Data De Criação: 2 Julho 2021
Data De Atualização: 1 Julho 2024
Anonim
Calcular covariância - Conselhos
Calcular covariância - Conselhos

Contente

Covariância é um cálculo estatístico para tornar a relação entre dois conjuntos de dados mais transparente. Por exemplo, suponha que os antropólogos estudem a altura e o peso de uma população em uma cultura específica. Para cada pessoa no estudo, a altura e o peso podem ser exibidos com um par de dados (x, y). Esses valores podem ser usados ​​em uma fórmula padrão para calcular a relação de covariância. Este artigo primeiro explica os cálculos para determinar a covariância de um conjunto de dados. A seguir, duas outras maneiras automatizadas de determinar o resultado serão discutidas.

Dar um passo

Método 1 de 4: Calcule a covariância manualmente usando a fórmula padrão

  1. Aprenda a fórmula de covariância padrão e suas partes. A fórmula padrão para calcular a covariância é Σ(XeuXmédia)(yeuymédia)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Construa sua tabela de dados. Antes de começar, é útil coletar seus dados. Crie uma tabela com cinco colunas. Você deve declarar cada coluna da seguinte forma:
    • X{ displaystyle x}Calcule a média dos x pontos de dados. Este conjunto de dados de amostra contém 9 números. Para encontrar a média, some-os e divida a soma por 9. Isso dá o resultado 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Quando você divide isso por 9, obtém a média 4,89. Este é o valor que você usará como x (média) para os próximos cálculos.
    • Calcule a média dos pontos de dados y. Esta coluna y também deve consistir em 9 pontos de dados que coincidem com os pontos de dados x. Determine a média deles. Para este conjunto de dados de amostra, isso se torna 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Divida esse total por 9 para obter uma média de 5,44. Você usará 5,44 como o valor de y (média) para os próximos cálculos.
    • Calcule os valores (XeuXmédia){ displaystyle (x_ {i} -x _ { text {avg}})}Calcule os valores (yeuymédia){ displaystyle (y_ {i} -y _ { text {avg}})}Calcule os produtos para cada linha de dados. Você preenche as linhas da última coluna multiplicando os números que você calculou nas duas colunas anteriores de (XeuXmédia){ displaystyle (x_ {i} -x _ { text {avg}})}Encontre a soma dos valores na última coluna. É aqui que entra o símbolo comes. Depois de fazer todos os cálculos até agora, some os resultados. Para este conjunto de dados de amostra, você agora deve ter nove valores na última coluna. Some esses nove números. Preste muita atenção se um número é positivo ou negativo.
      • A soma deste conjunto de dados de amostra deve totalizar -64,57. Escreva esse total no espaço na parte inferior da coluna. Este é o valor do numerador da fórmula de covariância padrão.
    • Calcule o denominador da fórmula de covariância. O numerador da fórmula de covariância padrão é o valor que você acabou de calcular. O denominador é representado por (n-1) e é um a menos que o número de pares de dados em seu conjunto de dados.
      • Neste exemplo de problema, há nove pares de dados, então n é 9. Portanto, o valor de (n-1) é igual a 8.
    • Divida o numerador pelo denominador. A última etapa no cálculo da covariância é dividir o numerador, Σ(XeuXmédia)(yeuymédia){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Observe quais são os cálculos repetitivos. Covariância é um cálculo que você deve fazer manualmente algumas vezes para entender o significado do resultado. No entanto, se você for usar a covariância rotineiramente para interpretar dados, precisará de uma maneira mais rápida e automatizada de obter os resultados. Você já deve ter notado que, com nosso conjunto de dados relativamente pequeno de apenas nove pares de dados, os cálculos consistiam em duas médias, dezoito subtrações separadas, nove multiplicações, uma adição e, finalmente, outra divisão. São 31 cálculos relativamente pequenos para encontrar a solução. Ao longo do caminho, você corre o risco de perder sinais negativos ou copiar os resultados incorretamente, de modo que a resposta não seja mais correta.
    • Crie uma planilha para calcular a covariância. Se você estiver familiarizado com o Excel (ou outro programa de cálculo), pode criar facilmente uma tabela para determinar a covariância. Identifique os títulos das cinco colunas como fez para os cálculos à mão: x, y, (x (i) -x (média)), (y (i) -y (média)) e Produto.
      • Para simplificar a nomenclatura, chame a terceira coluna de algo como "diferença x" e a quarta coluna de "diferença y", desde que você se lembre do significado dos dados.
      • Se a tabela começar no canto superior esquerdo da planilha, a célula A1 será rotulada como x, enquanto os outros rótulos continuarão até a célula E1.
    • Insira os pontos de dados. Insira os valores dos dados nas duas colunas x e y. Lembre-se de que a ordem dos pontos de dados é importante, portanto, você deve combinar cada y com o valor correspondente de x.
      • Os valores de x começam na célula A2 e continuam até o número de pontos de dados de que você precisa.
      • Os valores de y começam na célula B2 e continuam até o número de pontos de dados de que você precisa.
    • Determine as médias dos valores x e y. O Excel calcula as médias para você muito rapidamente. Na primeira célula em branco abaixo de cada coluna de dados, digite a fórmula = AVERAGE (A2: A ___). Preencha o espaço vazio com o número da célula que corresponde ao seu último ponto de dados.
      • Por exemplo, se você tiver 100 pontos de dados, as células A2 a A101 serão preenchidas, portanto, na célula você digitará = AVERAGE (A2: A101).
      • Para os dados y, digite a fórmula = AVERAGE (B2: B101).
      • Lembre-se de que uma fórmula no Excel começa com um sinal "=".
    • Digite a fórmula para a coluna (x (i) -x (média)). Na célula C2, insira a fórmula para calcular a primeira subtração. Esta fórmula torna-se: = A2 -___. Preencha o espaço em branco com o endereço da célula contendo a média dos dados x.
      • Por exemplo, dos 100 pontos de dados, a média estará na célula A103, então sua fórmula se torna: = A2-A103.
    • Repita a fórmula para os pontos de dados (y (i) -y (avg)). Seguindo o mesmo exemplo, ele entra na célula D2. A fórmula torna-se: = B2-B103.
    • Digite a fórmula para a coluna "Produto". Na quinta coluna, digite na célula E2 a fórmula para calcular o produto das duas células anteriores. Isso então se torna: = C2 * D2.
    • Copie as fórmulas para preencher a tabela. Até agora, você programou apenas os primeiros pontos de dados na linha 2. Usando o mouse, marque as células C2, D2 e ​​E2. Posicione o cursor na pequena caixa no canto inferior direito até que um sinal de mais apareça. Clique e segure o botão do mouse e arraste o mouse para baixo para expandir a seleção e preencher toda a tabela de dados. Esta etapa copiará automaticamente as três fórmulas das células C2, D2 e ​​E2 para a tabela inteira. A tabela deve ser preenchida automaticamente com todos os cálculos.
    • Programe a soma da última coluna. Você precisa da soma dos itens na coluna "Produto". Na célula em branco imediatamente abaixo do último ponto de dados dessa coluna, digite a fórmula: = SUM (E2: E ___). Preencha o espaço em branco com o endereço da célula do último ponto de dados.
      • No exemplo com 100 pontos de dados, esta fórmula vai para a célula E103. Tipo: = SOMA (E2: E102).
    • Determine a covariância. Você também pode fazer com que o Excel execute o cálculo final para você. O último cálculo na célula E103 em nosso exemplo representa o numerador da fórmula de covariância. Logo abaixo dessa célula, digite a fórmula: = E103 / ___. Preencha o espaço vazio com o número de pontos de dados que você possui. Em nosso exemplo, é 100. O resultado é a covariância de seus dados.

Método 3 de 4: usando calculadoras de covariância online

  1. Pesquise online por calculadoras de covariância. Várias escolas, empresas ou outras fontes têm sites que calculam os valores de covariância com muita facilidade para você. Use o termo de pesquisa "calculadora de covariância" em um mecanismo de pesquisa.
  2. Insira seus dados. Leia as instruções no site com atenção para certificar-se de inserir as informações corretamente. É importante que seus pares de dados sejam mantidos em ordem, caso contrário, o resultado gerado será uma covariância incorreta. Os sites têm estilos diferentes de entrada de dados.
    • Por exemplo, no site http://ncalculators.com/statistics/covariance-calculator.htm, há uma caixa horizontal para inserir os valores de xe uma segunda caixa horizontal para inserir os valores de y. Você deve inserir seus dados separados por vírgulas. Assim, o conjunto de dados x calculado anteriormente neste artigo deve ser inserido como 1,3,2,5,8,7,12,2,4. Os dados de y como 8,6,9,4,3,3,2,7,7.
    • Em outro site, https://www.thecalculator.co/math/Covariance-Calculator-705.html, você será solicitado a inserir os dados x na primeira caixa. Os dados são inseridos verticalmente, com um item por linha. Portanto, a entrada neste site se parece com:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Calcule seus resultados. O atrativo desses cálculos online é que, depois de inserir os dados, normalmente você só precisa clicar no botão "Calcular" e os resultados aparecerão automaticamente. A maioria dos sites fornecerá os cálculos intermediários de x (média), y (média) e n.

Método 4 de 4: Interpretando os resultados da covariância

  1. Procure um relacionamento positivo ou negativo. A covariância é um único número estatístico que indica a relação entre um conjunto de dados e outro. No exemplo citado na introdução, são medidos a altura e o peso. Você esperaria que, à medida que as pessoas crescem, seu peso também aumenta, levando a uma visão de covariância positiva. Outro exemplo: suponha que sejam coletados dados que indiquem o número de horas que alguém pratica golfe e a pontuação que obtém. Nesse caso, você espera uma covariância negativa, o que significa que, à medida que o número de horas de treinamento aumenta, a pontuação do golfe diminui. (No golfe, uma pontuação mais baixa é melhor).
    • Considere o conjunto de dados de amostra calculado acima. A covariância resultante é -8,07. O sinal de menos significa que conforme os valores de x aumentam, os valores de y tendem a diminuir. Você pode ver que isso é verdade observando alguns dos valores. Por exemplo, os valores x de 1 e 2 correspondem aos valores y de 7, 8 e 9. Os valores x de 8 e 12 estão ligados aos valores y de 3 e 2, respectivamente .
  2. Interprete a magnitude da covariância. Se o número da pontuação de covariância for grande, um grande número positivo ou um grande número negativo, você pode interpretar isso como dois elementos de dados fortemente conectados, de forma positiva ou negativa.
    • A covariância de -8,07 do conjunto de dados de amostra é bastante grande. Observe que os dados variam de 1 a 12. Portanto, 8 é um número bastante grande. Isso indica uma relação bastante forte entre os conjuntos de dados x e y.
  3. Entenda a falta de relacionamento. Se o seu resultado for uma covariância igual ou muito próxima de 0, você pode concluir que os pontos de dados não estão relacionados. Ou seja, um aumento em um valor pode, mas não necessariamente, resultar em um aumento no outro. Os dois termos estão ligados quase aleatoriamente.
    • Suponha que você relacione o tamanho dos sapatos com as notas dos exames. Como há tantos fatores que influenciam as notas dos exames de um aluno, pode-se esperar uma pontuação de covariância próxima de 0. Isso indica que quase não há relação entre os dois valores.
  4. Visualize o relacionamento graficamente. Para entender visualmente a covariância, você pode plotar seus pontos de dados em um gráfico x, y. Ao fazer isso, você verá facilmente que os pontos, embora não exatamente em linha reta, tendem a se aproximar de um aglomerado em uma linha diagonal do canto superior esquerdo para o inferior direito. Esta é a descrição de uma covariância negativa. Você também pode ver que o valor da covariância é igual a -8,07. Este é um número bastante grande em comparação com os pontos de dados. O número alto sugere que a covariância é bastante forte, o que você pode deduzir da forma linear dos pontos de dados.
    • Para passar por isso novamente, leia os artigos sobre como desenhar pontos em um sistema de coordenadas no wikiHow.

Avisos

  • A covariância tem aplicação limitada em estatísticas. Freqüentemente, é uma etapa para calcular os coeficientes de correlação ou outros conceitos. Tenha cuidado com interpretações excessivamente ousadas com base em uma pontuação de covariância.