Як обчислити коефіцієнт рангової кореляції спірмена

Коефіцієнт кореляції рангу Спірмена дозволяє визначити, чи існує між двома змінними залежність, що виражається монотонної функцією (тобто при зростанні однієї змінної збільшується і друга, і навпаки). Наведені в статті прості кроки дозволять вам проводити розрахунки вручну, а також обчислювати коефіцієнт кореляції за допомогою програм Excel і R.

кроки

Метод 1 з 3:
обчислення вручну
Зображення з назвою Table_338
1. Складіть таблицю даних. Таким чином ви впорядкуйте інформацію, необхідну для розрахунку коефіцієнта кореляції рангу Спірмена. При цьому вам знадобиться:
  • 6 колонок, озаглавлених так, як показано вище на малюнку.
  • Кількість рядків, відповідне числу пар змінних.
  • Зображення з назвою Table2_983
    2. Заповніть перші дві колонки парами змінних.
  • Зображення з назвою Table3_206
    3. У третій колонці запишіть номери (ранги) пар змінних від 1 до n (Загальне число пар). Дайте номер 1 парі з найменшим значенням в першій колонці, 2 - наступного за ним значенням, і так по зростанню величин змінної з першої колонки.
  • Зображення з назвою Table4_228
    4. У четвертій колонці зробіть те ж, що і в третій, але на цей раз пронумеруйте пари змінних по другій колонці таблиці.
  • Зображення з назвою Mean_742
    Якщо два (або більше) значення змінної в одній колонці однакові, розташуйте їх один за іншим і знайдіть середнє значення їх номери, а потім пронумеруйте їх цим середнім значенням.
    У наведеному справа прикладі два значення змінної збігаються і дорівнюють 5 в разі нормальної нумерації ці дані отримали б ранги 2 і 3. Оскільки значення однакові, знаходимо середню величину їх рангів. Середнє 2 і 3 дорівнює 2,5, тому обом величинам присвоюємо ранг 2,5.
  • Зображення з назвою Table5_263
    5. У колонці "d" обчисліть різницю між двома рангами з попередніх двох колонок. Наприклад, якщо ранг в третій колонці дорівнює 1, а в четвертій - 3, то різниця між ними складе 2. Знак не має значення, оскільки на наступному кроці ці числа будуть зведені в квадрат.
  • Зображення з назвою Table6_205
    6. Зведіть кожне значення з колонки "d" в квадрат і запишіть отримані величини в колонку "d".
  • 7. Підсумуйте всі значення з колонки "d". Ви визначите суму Σd.
    Зображення з назвою Step7_812
  • 8. Скористайтеся однією з наступних формул:
  • Якщо на попередніх етапах не зустрічалося однакових величин, просто підставте отриману суму в спрощену формулу для розрахунку коефіцієнта рангової кореляції Спірмена:
    Зображення з назвою Step8_271

    і замість "n" підставте число пар даних, внесених вами раніше в таблицю.
    Зображення з назвою Step9_402
  • Якщо на попередніх етапах траплялися однакові значення, скористайтеся стандартною формулою для обчислення коефіцієнта рангової кореляції Спірмена:
    Зображення з назвою Spearman.jpg
  • 9. Проаналізуйте результат. Отримане значення знаходиться між -1 і 1.
  • Якщо воно близьке до -1, кореляція негативна.
  • Якщо близько до 0, кореляція відсутня.
  • Якщо близько до 1, спостерігається позитивна кореляція.
  • Не забудьте поділити на суму змінних і взяти корінь. Після цього поділіть на Σd.
    Зображення з назвою Step7_812
  • Метод 2 з 3:
    Обчислення в Excel
    1. Створіть нові колонки з рангами, відповідними колонкам даних. Наприклад, якщо дані внесені в Колонку A2: A11, використовуйте функцію "= RANK (A2, A $ 2: A $ 11)" і занесіть результати для всіх рядків в нову колонку.
  • 2. Знайдіть ранги для однакових величин, як описано в кроках 3 і 4 методу 1.
  • 3. У новій осередку визначте кореляцію між двома колонками рангів за допомогою функції "= CORREL (C2: C11, D2: D11)". В даному випадку C і D - це колонки, що містять ранги. Таким чином, в даній комірці ви отримаєте коефіцієнт рангової кореляції Спірмена.
  • Метод 3 з 3:
    Обчислення в R
    1. Якщо у вас ще немає програми R для обробки статистичних даних, придбайте її (див. http: // r-project.org).
  • 2. Збережіть дані в форматі CSV, розташувавши їх в двох колонках, кореляцію між якими ви збираєтеся досліджувати. Зберегти файл в даному форматі легко за допомогою опції "Зберегти як".
  • 3. Відкрийте редактор R. Якщо ви ще не ввійшли в програму R, просто запустіть її. Для цього достатньо натиснути іконку R на робочому столі.
  • 4. Наберіть команди:
  • d <- read.csv ("NAME_OF_YOUR_CSV.csv") І натисніть клавішу введення
  • cor (rank (d [, 1]), rank (d [, 2]))
  • Поради

    • Як правило, набір даних повинен складатися не менше ніж з 5 пар для того, щоб можна було достовірно встановити яку-небудь кореляцію (3 пари було використано в прикладі вище для простоти).

    попередження

    • Коефіцієнт рангової кореляції Спірмена дозволяє встановити лише те, чи ростуть обидві змінні або зменшуються одночасно. Якщо розкид даних занадто великий, цей коефіцієнт НЕ дасть точного значення кореляції.
    • Наведена функція дасть вірний результат при відсутності однакових значень в масиві даних. Якщо такі значення існують, як в розглянутому нами прикладі, необхідно використовувати наступне визначення: коефіцієнт кореляції, заснований на ранги.
    Cхоже