Як зробити кореляційний аналіз

Як зробити кореляційний аналіз

При кореляційному аналізі намагаються встановити, чи є якийсь зв 'язок між двома значеннями в одній вибірці або між двома різними вибірками. Якщо буде виявлено зв 'язок, то необхідно з' ясувати, чи супроводжується він збільшення будь-якого одного показника зростанням або зменшенням іншого.

Інструкція

1. Вирішіть, між якими показниками вам необхідно провести кореляційний аналіз. При цьому врахуйте, що він допоможе вам встановити, чи можливо передбачити певні значення одного значення, знаючи величину іншого. З цією метою можете використовувати 2 різні методи: параметричний спосіб розрахунку коефіцієнта r (Браве-Пірсона) і визначення коефіцієнта кореляції rs (рангів Спирмена), який застосовується по відношенню до порядкових даних і є непараметричним.

2. Визначте коефіцієнт кореляції - величину, яка може бути в межах від одиниці до -1. При цьому, у разі позитивної кореляції даний коефіцієнт дорівнюватиме плюс одному, а при негативній - мінус одиниці. Можете побудувати графік відповідності значень, які ви хочете проаналізувати. На ньому ви отримаєте певну пряму лінію, що проходить через точки перетину показників кожної пари даних величин. У свою чергу, в тому випадку, якщо ці точки (відбиваючі значення) не вибудовуються у вас по прямій лінії і утворюють "хмару", то коефіцієнт кореляції в абсолютній величині буде менше одиниці, а по мірі округлення даної хмари наблизиться до нуля. Якщо коефіцієнт кореляції дорівнює 0, то це означає, що обидві змінні є повністю незалежними один від одного.

3. Зробіть висновки про зв 'язок між змінними. При цьому велике значення приділіть обсягу вибірки: чим вона більша, тим достовірнішою буде величина отриманого коефіцієнта кореляційного аналізу. Існують спеціальні таблиці, які містять критичні значення коефіцієнта кореляції по Браві-Пірсону і Спирмену. Дані показники можна використовувати для визначення різного числа ступеня свободи (воно дорівнює кількості пар за вирахуванням двох). Лише у випадку, коли коефіцієнти кореляції є більше даних критичних значень, вони будуть вважатися достовірними.