Como calcular o coeficiente de correlação de classificação de Spearman

Autor: Virginia Floyd
Data De Criação: 8 Agosto 2021
Data De Atualização: 20 Junho 2024
Anonim
Como calcular o coeficiente de correlação de classificação de Spearman - Sociedade
Como calcular o coeficiente de correlação de classificação de Spearman - Sociedade

Contente

O coeficiente de correlação do posto de Spearman permite determinar se existe uma dependência entre duas variáveis, expressa por uma função monotônica (ou seja, com o crescimento de uma variável, a segunda aumenta e vice-versa). As etapas simples fornecidas no artigo permitirão que você execute cálculos manualmente, bem como calcule o coeficiente de correlação usando Excel e R.

Passos

Método 1 de 3: Calcule manualmente

  1. 1 Crie uma tabela de dados. Isso organizará as informações de que você precisa para calcular o coeficiente de correlação de classificação de Spearman. Nesse caso, você precisará de:
    • 6 colunas, com título conforme mostrado acima.
    • O número de linhas correspondentes ao número de pares de variáveis.
  2. 2 Preencha as duas primeiras colunas com pares de variáveis.
  3. 3 Na terceira coluna, escreva os números (classificações) dos pares de variáveis ​​de 1 a n (número total de pares). Atribua o número 1 ao par com o valor mais baixo na primeira coluna, 2 ao próximo valor depois dele e assim por diante em ordem crescente dos valores da variável da primeira coluna.
  4. 4 Na quarta coluna, faça o mesmo que na terceira, mas desta vez numere os pares de variáveis ​​de acordo com a segunda coluna da tabela.
    • Se dois (ou mais) valores de uma variável em uma coluna são iguais, organize-os um após o outro e encontre a média de seus números e, em seguida, numere-os com essa média.
      No exemplo à direita, os dois valores da variável são iguais e iguais a 5; no caso da numeração normal, esses dados receberiam as classificações 2 e 3. Como os valores são iguais, encontramos o valor médio de suas classificações.A média de 2 e 3 é 2,5, então atribuímos a ambos uma classificação de 2,5.
  5. 5 Na coluna "d", calcule a diferença entre as duas classificações das duas colunas anteriores. Por exemplo, se a classificação na terceira coluna for 1 e na quarta for 3, a diferença entre elas será 2. O sinal não importa, pois na próxima etapa esses números serão elevados ao quadrado.
  6. 6 Quadrado cada valor na coluna "d" e escreva os valores resultantes na coluna "d".
  7. 7Adicione todos os valores na coluna "d". Você determinará a soma Σd.
  8. 8 Use uma das seguintes fórmulas:
    • Se nas etapas anteriores não atenderam aos mesmos valores, simplesmente substitua a soma resultante na fórmula simplificada para calcular o coeficiente de correlação de posto de Spearman:

      e substitua "n" pelo número de pares de dados que você inseriu na tabela anteriormente.
    • Se você encontrar os mesmos valores nas etapas anteriores, use a fórmula padrão para calcular o coeficiente de correlação de classificação de Spearman:
  9. 9 Analise o resultado. O valor resultante está entre -1 e 1.
    • Se estiver próximo a -1, a correlação é negativa.
    • Se próximo de 0, não há correlação.
    • Se próximo de 1, existe uma correlação positiva.
    • Lembre-se de dividir pela soma das variáveis ​​e obter a raiz. Em seguida, divida por Σd.

Método 2 de 3: Calcular no Excel

  1. 1 Crie novas colunas com classificações correspondentes às colunas de dados. Por exemplo, se os dados forem inseridos na coluna A2: A11, use a função "= RANK (A2, A $ 2: A $ 11)" e insira os resultados para todas as linhas em uma nova coluna.
  2. 2Encontre as classificações para as mesmas quantidades descritas nas etapas 3 e 4 do método 1.
  3. 3 Em uma nova célula, determine a correlação entre as duas colunas de classificação usando a função "= CORREL (C2: C11, D2: D11)". Nesse caso, C e D são colunas contendo classificações. Assim, nesta célula você obterá o coeficiente de correlação de posto de Spearman.

Método 3 de 3: Cálculo em R

  1. 1 Se você ainda não possui o software R para processamento de estatísticas, adquira um (consulte. http://www.r-project.org).
  2. 2 Salve os dados no formato CSV, organizando-os em duas colunas, a correlação entre a qual você vai investigar. É fácil salvar o arquivo neste formato usando a opção "Salvar como".
  3. 3 Abra o editor R. Se você ainda não estiver conectado ao programa R, basta iniciá-lo. Para fazer isso, basta clicar no ícone R na área de trabalho.
  4. 4 Digite os comandos:
    • d - leia.csv ("NAME_OF_YOUR_CSV.csv") e pressione Enter
    • cor (posto (d [, 1]), posto (d [, 2]))

Pontas

  • Como regra, o conjunto de dados deve ter pelo menos 5 pares para poder estabelecer qualquer correlação de forma confiável (3 pares foram usados ​​no exemplo acima para simplificar).

Avisos

  • O coeficiente de correlação de Spearman permite estabelecer apenas se ambas as variáveis ​​aumentam ou diminuem simultaneamente. Se a dispersão de dados for muito grande, este coeficiente não fornecerá o valor de correlação exato.
  • A função fornecida dará o resultado correto se não houver valores idênticos na matriz de dados. Se tais valores existirem, como em nosso exemplo, a seguinte definição deve ser usada: coeficiente de correlação baseado em classificação.