Як порахувати величину p або значення ймовірності

P-значення - це статистична величина, яка допомагає вченим визначити, чи коректні їх гіпотези. P-значення використовуються для визначення того, чи підпадають результати експерименту в діапазон значень, нормальний для спостережуваної величини. Зазвичай якщо P-значення для набору даних менше, ніж заздалегідь певне число (наприклад 0,05), то вчені повинні відхилити «нульову гіпотезу» свого експерименту. Іншими словами, вони зроблять висновок, що змінні в їхньому експерименті НЕ надають достатнього ефекту на результати. В даний час p-значення зазвичай можна знайти в довіднику, якщо спочатку порахувати значення хі-квадрат.

кроки

  1. Calculate P Value Step 1
1. Визначте очікувані в вашому експерименті результати. Зазвичай коли вчені проводять експеримент, у них вже є ідея того, які результати вважати «нормальними» або «типовими». Це може бути засноване на експериментальних результатах минулих дослідів, на достовірних наборах даних, на даних з наукової літератури, або вчений може ґрунтуватися на будь-яких інших джерелах. Для вашого експерименту визначте очікувані результати і висловіть їх у вигляді чисел.
  • Приклад: припустимо, більш ранні дослідження показали, що у вашій країні власники червоних машин частіше отримують штрафи за перевищення швидкості, ніж власники синіх. Наприклад, середні результати показують перевагу 2: 1 червоних машин перед синіми. Наше завдання - визначити, чи стосується поліція точно так же упереджено до кольору машин в вашому місті. Для цього ми будемо аналізувати штрафи, видані за перевищення швидкості. Якщо ми візьмемо випадковий набір з 150 штрафів за перевищення швидкості, виданих або власникам червоних, або синіх автомобілів, ми очікуємо, що 100 штрафів буде виписано власникам червоних автомобілів, а 50 - власникам синіх, якщо поліція в нашому місті так само упереджено ставиться до кольору машин, як це спостерігається по всій країні.
  • Calculate P Value Step 2
    2. Визначте спостерігаються результати вашого експерименту. Тепер, коли ви визначили очікувані результати, необхідно провести експеримент і знайти дійсні (або «спостережувані») значення. Вам знову необхідно представити ці результати у вигляді чисел. Якщо ми створюємо експериментальні умови, і спостережувані результати відрізняються від очікуваних, то у нас є дві можливості - або це сталося випадково, або це викликано саме нашим експериментом. Мета перебування p-значення як раз і полягає в тому, щоб визначити, чи відрізняються спостерігаються результати від очікуваних настільки, щоб можна було не відкидати «нульову гіпотезу» - гіпотезу про те, що між експериментальними змінними і спостерігаються результатами немає ніякого зв`язку.
  • Приклад: припустимо, в нашому місті ми випадково вибрали 150 штрафів за перевищення швидкості, які були видані або власникам червоних, або власникам синіх автомобілів. Ми визначили, що 90 штрафів були виписані власникам червоних автомобілів, і 60 - власникам синіх. Це відрізняється від очікуваних результатів, які дорівнюють 100 і 50, відповідно. Чи справді наш експеримент (в даному випадку зміна джерела даних з державного рівня на міський) привів до даного зміни в результатах, або наша міська поліція ставиться до автомобілістів упереджено так само, як і в середньому по країні, а ми бачимо просто випадкове відхилення? P-значення допоможе нам це визначити.
  • Calculate P Value Step 3
    3. Визначте число ступенів свободи вашого експерименту. Число ступенів свободи - це ступінь змінності вашого експерименту, яка визначається числом категорій, які ви досліджуєте. Рівняння для числа ступенів свободи - Число ступенів свободи = n-1, де «n» - число категорій або змінних, які ви аналізуєте в своєму експерименті.
  • Приклад: в нашому експерименті дві категорії результатів: одна категорія для власників червоних машин і інша - для власників синіх машин. Тому в нашому експерименті у нас 2-1 = 1 ступінь свободи. Якби ми порівнювали червоні, сині та зелені машини, у нас було б 2 ступеня свободи і так далі.
  • Calculate P Value Step 4
    4. Порівняйте очікувані та спостережувані результати за допомогою критерію хі-квадрат. Хі-квадрат (пишеться «x») - це числове значення, яке вимірює різницю між очікуваними і спостерігаються значеннями експерименту. Рівняння для хі-квадрата наступне: x = Σ ((o-e) / e), де «o» - це спостережуване значення, а «e» - це очікуване значення. Підсумуйте результати даного рівняння для всіх можливих результатів (дивись нижче).
  • Зауважте, що дане рівняння включає оператор підсумовування Σ (Сигма). Іншими словами, вам необхідно підрахувати ((| o-e |-.05) / e) для кожного можливого результату і скласти отримані числа, щоб отримати значення критерію хі-квадрат. У нашому прикладі у нас два можливих результату - або машина, що отримала штраф червона, або синя. Тому ми повинні порахувати ((o-e) / e) двічі - один раз для червоних машин і один раз для синіх машин.
  • Приклад: давайте підставимо наші очікувані та спостережувані значення в рівняння x = Σ ((o-e) / e). Пам`ятайте, що через оператора підсумовування нам необхідно порахувати ((o-e) / e) двічі - один раз для червоних автомобілів і один раз - для синіх. Ми виконаємо цю роботу в такий спосіб:
  • x = ((90-100) / 100) + (60-50) / 50)
  • x = ((-10) / 100) + (10) / 50)
  • x = (100/100) + (100/50) = 1 + 2 = 3 .
  • Calculate P Value Step 5
    5. Оберіть рівень значущості. Тепер, коли ми знаємо число ступенів свободи нашого експерименту і дізналися значення критерію хі-квадрат, нам потрібно зробити ще одну річ перед тим, як ми знайдемо наше p-значення. Нам потрібно визначити рівень значущості. Говорячи простою мовою, рівень значущості показує, наскільки ми впевнені в наших результатах. Низьке значення для значимості відповідає низькій вірогідності того, що експериментальні результати вийшли випадковими і навпаки. Рівні значущості записуються у вигляді десяткових дробів (таких як 0,01), що відповідає ймовірності того, що експериментальні результати ми отримали випадково (в даному випадку ймовірність цього 1%).
  • За угодою, вчені зазвичай встановлюють рівень значущості своїх експериментів рівним 0,05, або 5%. Це означає, що експериментальні результати, які відповідають таким критерієм значимості, тільки з ймовірністю 5% могли вийти чисто випадково. Іншими словами, існує 95% вірогідність, що результати були викликані тим, як вчений маніпулював експериментальними змінними, а не випадково. Для більшості експериментів 95% впевненості наявності зв`язку між двома змінними досить, щоб вважати, що вони «дійсно» пов`язані один з одним.
  • Приклад: для нашого прикладу з червоними і синіми машинами, давайте підемо угодою між вченими і встановимо рівень значущості в 0.05.
  • Calculate P Value Step 6
    6. Використовуйте таблицю з даними розподілу хі-квадрат, щоб знайти p-значення. Вчені і статисти використовують великі таблиці для обчислення p-значення своїх експериментів. Дані таблиці зазвичай мають вертикальну вісь зліва, відповідну числу ступенів свободи, і горизонтальну вісь зверху, відповідну p-значення. Використовуйте дані таблиці, щоб спочатку знайти число ваших ступенів свободи, потім подивіться на ваш ряд зліва направо, поки не знайдете перше значення, більше вашого значення хі-квадрат. Подивіться на відповідне p-значення вгорі вашого стовпчика. Потрібне вам p-значення знаходиться між цим числом і наступним за ним (тим, яке знаходиться лівіше вашого).
  • Таблиці з розподілом хі-квадрат можна отримати з багатьох джерел - їх можна просто знайти онлайн, або подивитися в наукових книгах або книгах по статистиці. Якщо у вас немає під рукою таких книг, використовуйте картинку вище або яку-небудь таблицю онлайн, яку можна переглядати безкоштовно, наприклад на сайті medcalc.org. вона розташована тут.
  • Приклад: наше значення критерію хі-квадрат дорівнювало 3. Тому давайте використаємо таблицю розподілу хі-квадрат на зображенні вище, щоб знайти приблизне p-значення. Так як ми знаємо, що в нашому експерименті за все 1 ступінь свободи, виберемо найпершу рядок. Йдемо зліва направо по цьому рядку, поки не зустрінемо значення, більше 3, нашого значення критерію хі-квадрат. Перше, що ми знаходимо, це 3,84. Дивимося вгору нашого стовпчика і бачимо, що відповідне p-значення дорівнює 0,05. Це означає, що наше p-значення між 0,05 і 0,1 (Наступне p-значення в таблиці за зростанням).
  • Calculate P Value Step 7
    7. Вирішіть, відхилити або залишити нульову гіпотезу. Так як ви визначили приблизну p-значення для вашого експерименту, вам необхідно вирішити, відхиляти чи нульову гіпотезу вашого експерименту чи ні (нагадуємо, це гіпотеза про те, що експериментальні змінні, якими ви маніпулювали НЕ вплинули на спостережувані вами результати). Якщо p-значення менше, ніж рівень значимості - вітаємо, ви довели, що дуже ймовірна зв`язок між змінними, якими ви маніпулювали, і результатами, які ви спостерігали. Якщо p-значення вище, ніж рівень значущості, не можна з упевненістю сказати, чи були які спостерігаються вами результати результатом чистої випадковості або маніпуляцією даними змінними.
  • Приклад: наше p-значення знаходиться між 0,05 і 0,1. це явно НЕ менше, ніж 0,05, тому, на жаль, ми не можемо відхилити нашу нульову гіпотезу. Це означає, що ми не досягли мінімум 95% ймовірності того, щоб сказати, що поліція в нашому місті видає штрафи власникам червоних і синіх автомобілів з такою ймовірністю, яка досить сильно відрізняється від середньої по країні.
  • Іншими словами, існує 5-10% шанс, що спостерігаються нами результати - це не наслідки зміни місця (аналізу міста, а не всієї країни), а просто випадковість. Так як заявлена ​​нами точність не повинна перевищувати 5%, ми не можемо сказати з упевненістю, що поліція нашого міста менш упереджено ставиться до власників червоних автомобілів - існує невелика (але статистично значуща) ймовірність, що це не так.
  • Поради

    • Науковий калькулятор дозволяє полегшити обчислення. Ви також можете використовувати калькулятори онлайн.
    • Ви можете підрахувати p-значення з використанням деяких комп`ютерних програм, включаючи як часто використовувані програми електронних таблиць, так і більш спеціалізоване програмне забезпечення.
    Cхоже