Цікаво

Лінійний регресійний аналіз

Лінійний регресійний аналіз

Лінійна регресія - це статистична методика, яка використовується для отримання більш детальної інформації про зв'язок між незалежною (предикторною) змінною та залежною (критерійною) змінною. Якщо у вашому аналізі є більше однієї незалежної змінної, це називається множинною лінійною регресією. Загалом, регресія дозволяє досліднику задати загальне запитання: «Який найкращий предиктор ...?»

Наприклад, скажімо, що ми вивчали причини ожиріння, вимірювані за індексом маси тіла (ІМТ). Зокрема, ми хотіли дізнатися, чи є такі змінні значущими прогнозами ІМТ людини: кількість їжі фаст-фуду, з'їденої на тиждень, кількість годин телевізора, що переглядаються на тиждень, кількість хвилин, проведених фізичними вправами на тиждень, та ІМТ батьків . Лінійна регресія була б хорошою методологією для цього аналізу.

Рівняння регресії

Коли ви проводите аналіз регресії з однією незалежною змінною, рівнянням регресії є Y = a + b * X, де Y - залежна змінна, X - незалежна змінна, a - константа (або перехоплення), а b - нахил лінії регресії. Наприклад, скажімо, що GPA найкраще прогнозувати за рівнянням регресії 1 + 0,02 * IQ. Якщо у студента показник IQ 130, то його середній бал складе 3,6 (1 + 0,02 * 130 = 3,6).

Коли ви проводите регресійний аналіз, в якому у вас є більше однієї незалежної змінної, рівняння регресії дорівнює Y = a + b1 * X1 + b2 * X2 +… + bp * Xp. Наприклад, якби ми хотіли включити до нашого аналізу GPA більше змінних, таких як заходи мотивації та самодисципліни, ми використали б це рівняння.

R-площа

R-квадрат, також відомий як коефіцієнт визначення, є загальноприйнятою статистикою для оцінки примірності рівняння рівняння регресії. Тобто, наскільки хороші всі ваші незалежні змінні при прогнозуванні вашої залежної змінної? Значення R-квадрата коливається від 0,0 до 1,0 і може бути помножено на 100, щоб отримати відсоток відхилення, що пояснюється. Наприклад, повертаючись до нашого рівняння регресії GPA лише з однією незалежною змінною (IQ)… Скажімо, наш R-квадрат для рівняння становив 0,4. Ми можемо трактувати це так, що 40% дисперсії в GPA пояснюється IQ. Якщо потім додати наші дві інші змінні (мотивація та самодисципліна) і R-квадрат збільшується до 0,6, це означає, що IQ, мотивація та самодисципліна разом пояснюють 60% дисперсії в балах GPA.

Регресійний аналіз, як правило, проводиться за допомогою статистичного програмного забезпечення, наприклад SPSS або SAS, і R-квадрат розраховується для вас.

Інтерпретація регресійних коефіцієнтів (b)

Коефіцієнти b з рівнянь, наведених вище, представляють силу та напрямок взаємозв'язку між незалежними та залежними змінними. Якщо ми подивимось на рівняння GPA та IQ, 1 + 0,02 * 130 = 3,6, 0,02 - коефіцієнт регресії для змінної IQ. Це говорить нам про те, що напрямок відносин є позитивним, так що зі збільшенням IQ зростає і GPA. Якщо рівняння було 1 - 0,02 * 130 = Y, то це означало б, що зв'язок між IQ і GPA був негативним.

Припущення

Існує кілька припущень щодо даних, які необхідно виконати для проведення лінійного регресійного аналізу:

  • Лінійність: Передбачається, що зв'язок між незалежною та залежною змінними лінійний. Хоча це припущення ніколи не може бути повністю підтверджене, перегляд розкиду ваших змінних може допомогти визначити це. Якщо кривина у взаємозв'язку присутня, ви можете розглянути можливість перетворення змінних або явно враховувати нелінійні компоненти.
  • Нормальність: Передбачається, що залишки ваших змінних зазвичай розподіляються. Тобто помилки в прогнозуванні значення Y (залежної змінної) розподіляються таким чином, що наближається до нормальної кривої. Ви можете переглянути гістограми або звичайні графіки ймовірності, щоб перевірити розподіл змінних та їх залишкових значень.
  • Незалежність: Передбачається, що помилки в прогнозуванні значення Y всі незалежні одна від одної (не співвідносяться).
  • Гомоседастичність: Передбачається, що дисперсія навколо лінії регресії однакова для всіх значень незалежних змінних.

Джерело

  • StatSoft: Електронний підручник з статистики. (2011 р.). //www.statsoft.com/textbook/basic-statistics/#Crosstabulationb.


Video, Sitemap-Video, Sitemap-Videos