Como calcular o coeficiente de correlação linear

Autor: Eric Farmer
Data De Criação: 7 Marchar 2021
Data De Atualização: 1 Julho 2024
Anonim
Regressão Linear Simples - Ajuste de Reta
Vídeo: Regressão Linear Simples - Ajuste de Reta

Contente

O coeficiente de correlação (ou coeficiente de correlação linear) é denotado como "r" (em casos raros como "ρ") e caracteriza a correlação linear (ou seja, a relação que é dada por algum valor e direção) de duas ou mais variáveis. O valor do coeficiente está entre -1 e +1, ou seja, a correlação pode ser positiva e negativa. Se o coeficiente de correlação for -1, há uma correlação negativa perfeita; se o coeficiente de correlação for +1, há uma correlação positiva perfeita. Caso contrário, existe uma correlação positiva entre as duas variáveis, uma correlação negativa ou nenhuma correlação. O coeficiente de correlação pode ser calculado manualmente, com calculadoras online gratuitas ou com uma boa calculadora gráfica.

Passos

Método 1 de 4: Calculando o Coeficiente de Correlação Manualmente

  1. 1 Coletar dados. Antes de começar a calcular o coeficiente de correlação, estude esses pares de números. Melhor escrevê-los em uma tabela que pode ser organizada vertical ou horizontalmente. Rotule cada linha ou coluna com "x" e "y".
    • Por exemplo, dados quatro pares de valores (números) das variáveis ​​"x" e "y". Você pode criar a seguinte tabela:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Calcule a média aritmética "x". Para fazer isso, some todos os valores x e, a seguir, divida o resultado pelo número de valores.
    • Em nosso exemplo, existem quatro valores para a variável "x". Para calcular a média aritmética "x", adicione esses valores e, em seguida, divida a soma por 4. Os cálculos são escritos da seguinte forma:
    • μx=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μx=12/4{ displaystyle mu _ {x} = 12/4}
    • μx=3{ displaystyle mu _ {x} = 3}
  3. 3 Encontre a média aritmética "y". Para isso, siga as mesmas etapas, ou seja, some todos os valores de y e, a seguir, divida a soma pelo número de valores.
    • Em nosso exemplo, quatro valores da variável "y" são fornecidos. Adicione esses valores e, em seguida, divida a soma por 4. Os cálculos serão escritos da seguinte forma:
    • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μy=16/4{ displaystyle mu _ {y} = 16/4}
    • μy=4{ displaystyle mu _ {y} = 4}
  4. 4 Calcule o desvio padrão "x". Após calcular as médias de "x" e "y", encontre os desvios-padrão dessas variáveis. O desvio padrão é calculado usando a seguinte fórmula:
    • σx=1n1Σ(xμx)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • Em nosso exemplo, os cálculos serão escritos assim:
    • σx=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σx=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σx=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σx=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σx=1,83{ displaystyle sigma _ {x} = 1,83}
  5. 5 Calcule o desvio padrão "y". Siga as etapas descritas na etapa anterior. Use a mesma fórmula, mas insira os valores y.
    • Em nosso exemplo, os cálculos serão escritos assim:
    • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σy=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σy=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σy=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σy=2,58{ displaystyle sigma _ {y} = 2,58}
  6. 6 Escreva a fórmula básica para calcular o coeficiente de correlação. Esta fórmula inclui as médias, desvios padrão e o número (n) de pares de números de ambas as variáveis. O coeficiente de correlação é denotado como "r" (em casos raros como "ρ"). Este artigo usa uma fórmula para calcular o coeficiente de correlação de Pearson.
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • Aqui e em outras fontes, as quantidades podem ser denotadas de maneiras diferentes. Por exemplo, algumas fórmulas contêm “ρ” e “σ”, enquanto outras contêm “r” e “s”. Alguns livros fornecem fórmulas diferentes, mas são contrapartes matemáticas da fórmula acima.
  7. 7 Calcule o coeficiente de correlação. Você calculou as médias e os desvios padrão de ambas as variáveis, portanto, pode usar a fórmula para calcular o coeficiente de correlação. Lembre-se de que "n" é o número de pares de valores para ambas as variáveis. Outros valores foram calculados anteriormente.
    • Em nosso exemplo, os cálculos serão escritos assim:
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • ρ=(13){ displaystyle rho = left ({ frac {1} {3}} right) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle left ({ frac {1-3} {1,83}} right) * left ({ frac {1-4} {2,58}} right) + left ({ frac {2 -3} {1,83}} direita) * esquerda ({ frac {3-4} {2,58}} direita)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + left ({ frac {4-3} {1,83}} right) * left ({ frac {5-4} {2,58}} right) + left ({ frac { 5-3} {1,83}} direita) * esquerda ({ frac {7-4} {2,58}} direita)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = left ({ frac {1} {3}} right) * left ({ frac {6 + 1 + 1 + 6} {4.721}} right)}
    • ρ=(13)2,965{ displaystyle rho = left ({ frac {1} {3}} right) * 2.965}
    • ρ=(2,9653){ displaystyle rho = left ({ frac {2.965} {3}} right)}
    • ρ=0,988{ displaystyle rho = 0,988}
  8. 8 Analise o resultado. Em nosso exemplo, o coeficiente de correlação é 0,988. Esse valor de alguma forma caracteriza um determinado conjunto de pares de números. Preste atenção ao sinal e à magnitude do valor.
    • Como o valor do coeficiente de correlação é positivo, existe uma correlação positiva entre as variáveis ​​"x" e "y". Ou seja, conforme o valor de "x" aumenta, o valor de "y" também aumenta.
    • Como o valor do coeficiente de correlação é muito próximo de +1, os valores das variáveis ​​"x" e "y" são altamente correlacionados. Se você colocar pontos no plano de coordenadas, eles estarão localizados próximos a alguma linha reta.

Método 2 de 4: Usando calculadoras online para calcular o coeficiente de correlação

  1. 1 Encontre uma calculadora na Internet para calcular o coeficiente de correlação. Este coeficiente é freqüentemente calculado em estatísticas. Se houver muitos pares de números, é quase impossível calcular o coeficiente de correlação manualmente. Portanto, existem calculadoras online para calcular o coeficiente de correlação. Em um mecanismo de pesquisa, digite "calculadora de coeficiente de correlação" (sem aspas).
  2. 2 Inserir dados. Verifique as instruções no site para inserir os dados corretos (pares de números). É imperativo inserir os pares de números apropriados; caso contrário, você obterá o resultado errado. Lembre-se de que diferentes sites têm diferentes formatos de entrada.
    • Por exemplo, em http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, os valores das variáveis ​​xey são inseridos em duas linhas horizontais. Os valores são separados por vírgulas. Ou seja, em nosso exemplo, os valores "x" são inseridos assim: 1,2,4,5, e os valores "y" como este: 1,3,5,7.
    • Em outro site, http://www.alcula.com/calculators/statistics/correlation-coefficient/, os dados são inseridos verticalmente; neste caso, não confunda os pares de números correspondentes.
  3. 3 Calcule o coeficiente de correlação. Após inserir os dados, basta clicar no botão "Calcular", "Calcular" ou semelhante para obter o resultado.

Método 3 de 4: usando uma calculadora gráfica

  1. 1 Inserir dados. Pegue uma calculadora gráfica, vá para o modo de cálculo estatístico e selecione o comando "Editar".
    • Calculadoras diferentes requerem que diferentes teclas sejam pressionadas. Este artigo descreve a calculadora Texas Instruments TI-86.
    • Pressione [2nd] - Stat (acima da tecla +) para entrar no modo de cálculo estatístico. Em seguida, pressione F2 - Editar.
  2. 2 Exclua os dados salvos anteriormente. A maioria das calculadoras mantém as estatísticas que você insere até que você as apague. Para evitar confundir dados antigos com novos, primeiro exclua todas as informações armazenadas.
    • Use as setas do teclado para mover o cursor e destacar o título 'xStat'. Em seguida, pressione Limpar e Enter para limpar todos os valores inseridos na coluna xStat.
    • Use as setas do teclado para destacar o título 'yStat'. Em seguida, pressione Limpar e Enter para limpar todos os valores inseridos na coluna yStat.
  3. 3 Insira os dados iniciais. Use as setas do teclado para mover o cursor para a primeira célula sob o título "xStat". Insira o primeiro valor e pressione Enter. Na parte inferior da tela, “xStat (1) = __” é exibido, com o valor inserido substituindo um espaço. Depois de pressionar Enter, o valor inserido aparecerá na tabela e o cursor se moverá para a próxima linha; isso exibirá "xStat (2) = __" na parte inferior da tela.
    • Insira todos os valores para a variável "x".
    • Depois de inserir todos os valores de x, use as teclas de seta para navegar até a coluna yStat e insira os valores de y.
    • Depois de inserir todos os pares de números, pressione Sair para limpar a tela e sair do modo de agregação.
  4. 4 Calcule o coeficiente de correlação. Caracteriza o quão próximos os dados estão de uma certa linha reta. A calculadora gráfica pode determinar rapidamente a linha reta adequada e calcular o coeficiente de correlação.
    • Clique em Stat - Calc. Na TI-86, pressione [2nd] - [Stat] - [F1].
    • Selecione a função de regressão linear. Na TI-86, pressione [F3], que é rotulado como "LinR". A tela exibirá a linha "LinR _" com um cursor piscando.
    • Agora insira os nomes de duas variáveis: xStat e yStat.
      • Na TI-86, abra a lista de nomes; para fazer isso, pressione [2nd] - [List] - [F3].
      • As variáveis ​​disponíveis são exibidas na linha inferior da tela. Selecione [xStat] (provavelmente você precisa pressionar F1 ou F2 para fazer isso), insira uma vírgula e selecione [yStat].
      • Pressione Enter para processar os dados inseridos.
  5. 5 Analise seus resultados. Ao pressionar Enter, a tela exibirá as seguintes informações:
    • y=uma+bx{ displaystyle y = a + bx}: esta é a função que descreve a linha. Observe que a função não está escrita na forma padrão (y = kx + b).
    • uma={ displaystyle a =}... Esta é a coordenada y da interseção da linha reta com o eixo y.
    • b={ displaystyle b =}... Esta é a inclinação da linha.
    • corr={ displaystyle { text {corr}} =}... Este é o coeficiente de correlação.
    • n={ displaystyle n =}... Este é o número de pares de números que foram usados ​​nos cálculos.

Método 4 de 4: explicando os conceitos básicos

  1. 1 Compreenda o conceito de correlação. Correlação é a relação estatística entre duas quantidades. O coeficiente de correlação é um valor numérico que pode ser calculado para quaisquer dois conjuntos de dados. O valor do coeficiente de correlação está sempre na faixa de -1 a +1 e caracteriza o grau de relacionamento entre duas variáveis.
    • Por exemplo, dada a altura e idade das crianças (cerca de 12 anos). Provavelmente, haverá uma forte correlação positiva, porque as crianças ficam mais altas com a idade.
    • Um exemplo de correlação negativa: segundos de penalidade e tempo gasto no treinamento de biatlo, ou seja, quanto mais um atleta treina, menos segundos de penalidade serão concedidos.
    • Finalmente, às vezes há muito pouca correlação (positiva ou negativa), como entre o tamanho do sapato e as notas em matemática.
  2. 2 Lembre-se de como calcular a média aritmética. Para calcular a média aritmética (ou média), você precisa encontrar a soma de todos esses valores e, em seguida, dividi-la pelo número de valores. Lembre-se de que a média aritmética é necessária para calcular o coeficiente de correlação.
    • O valor médio de uma variável é indicado por uma letra com uma barra horizontal acima dela. Por exemplo, no caso das variáveis ​​"x" e "y", seus valores médios são denotados como segue: x̅ e y̅. A média é às vezes indicada pela letra grega "μ" (mu). Para escrever a média aritmética dos valores da variável "x", use a notação μx ou μ (x).
    • Por exemplo, dados os seguintes valores para a variável "x": 1,2,5,6,9,10. A média aritmética desses valores é calculada da seguinte forma:
      • μx=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μx=33/6{ displaystyle mu _ {x} = 33/6}
      • μx=5,5{ displaystyle mu _ {x} = 5,5}
  3. 3 Observe a importância do desvio padrão. Em estatística, o desvio padrão caracteriza o grau de dispersão dos números em relação à média. Se o desvio padrão for pequeno, os números estão próximos da média; se o desvio padrão for grande, os números estão longe da média.
    • O desvio padrão é indicado pela letra "s" ou pela letra grega "σ" (sigma). Assim, o desvio padrão dos valores da variável "x" é denotado da seguinte forma: sx ou σx.
  4. 4 Lembre-se do símbolo para a operação de soma. O símbolo de soma é um dos símbolos mais comuns em matemática e indica a soma dos valores. Este símbolo é a letra grega "Σ" (sigma maiúsculo).
    • Por exemplo, se forem dados os seguintes valores da variável "x": 1,2,5,6,9,10, então Σx significa:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Pontas

  • O coeficiente de correlação é às vezes chamado de "coeficiente de correlação de Pearson" em homenagem a seu desenvolvedor Carl Pearson.
  • Na maioria dos casos, quando o coeficiente de correlação é maior que 0,8 (positivo ou negativo), existe uma forte correlação; se o coeficiente de correlação for menor que 0,5 (positivo ou negativo), uma correlação fraca é observada.

Avisos

  • A correlação caracteriza a relação entre os valores de duas variáveis. Mas lembre-se de que a correlação não tem nada a ver com causalidade. Por exemplo, se você comparar a altura e o tamanho do sapato das pessoas, provavelmente encontrará uma forte correlação positiva. Geralmente, quanto mais alta a pessoa, maior o tamanho do sapato. Mas isso não significa que um aumento na altura leve a um aumento automático no tamanho do calçado, ou que pés maiores levem a um crescimento mais rápido. Essas quantidades são simplesmente inter-relacionadas.