Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Рабочая программа'
Рабочая программа составлена на основании ГОС ВПО специальности 351400 «Прикладная информатика (по областям)» (квалификация – информатик (квалификаци...полностью>>
'Программа дисциплины'
Методика формирования результирующей оценки промежуточного контроля отражена в программе согласно Приказу по ГУ-ВШЭ от 17.06.2002 № 1002 «О переходе ...полностью>>
'Семинар'
4.Открыть форум на сайте для родителей на тему: «Как определить склонность ребенка к употреблению средств приводящих к изменению сознания и меры профи...полностью>>
'Документ'
Гэтая праца – вынік шматгадовае дзейнасьці дзеля ўдасканаленьня збору правілаў беларускага клясычнага правапісу, першую кадыфікацыю якога зьдзейсьніў...полностью>>

Закон великих

Главная > Закон
Сохрани ссылку в одной из сетей:

Київський університет імені Бориса Грінченка

Олександр Рудик

Аналіз статистичних даних

і критерії прийняття гіпотез

Київ

2009



Передмова

Цей посібник є конспектом лекцій, які автор прочитав студентам Київського міського педагог-гічного університету імені Б.Д. Грінченка.

Перед знайомством з посібником бажано відновити у пам’яті базові поняття теорії ймо-вірностей: імовірнісний простір, подія, випадкова величина і її розподіл, сумісний розподіл випадко-вих величин, поняття про закон великих чисел і центральну граничну теорему. Ці питання студенти обов’язково вивчають перед знайомством з власне математичною статистикою. Для читача, який повсякденно не стикається з цими поняттями, таке знайомство бажане хоча б для впевненості у спроможності зрозуміти математичні основи викладених критеріїв. Цю впевненість створюють для психологічного комфорту, бо для спеціалістів-гуманітаріїв відповідні знання не є обов’язковими.

Виклад матеріалу є само замкненим. Щоб скористатися статистичними критеріями для виконання наукового педагогічного дослідження, достатньо використати лише інформацію, викладену в посібнику. Враховуючи спрямованість спеціальностей студентів, автор обійшов питання обґрунтування критеріїв, а зосередився на їх стислому і прозорому викладі, зручному для практичного використання. Публікації інших авторів поряд з викладом статистичних критеріїв містять детальний опис прикладів їх використання (див.:

  1. Гублер Е.В. Вычислительные методы анализа и распознавания патологических последствий. – Л.: Медицина, 1978. – 296 с.

  2. Носенко И.А. Начала статистики для лингвистов. – М.: Высшая школа, 1981. – 157 с.

  3. Рунион Р. Справочник по непараметрической статистике. – М.: Финансы и статистика, 1982. – 198 с.

  4. Сидоренко Е.В. Математические методы обра-ботки в психологии. – СПб., Речь, 2001. – 349 с.

  5. Стивенс С. Математика, измерение и психо-физика. Экспериментальная психология / Под. ред. С.С. Стивенса / Перевод с англ. под ред. действ. чл. АМН СССР П..К. Анохина, док. пед. наук В.А. Артемова. – М.: Иностранная литература, 1960. – Т. 1. – С. 19–92.

  6. J. Green, M. D’Olivera. Learning to Use Statistical Tests in Psychology: a Student’s Guide. – Milton Keynes Philadelphia, Open University Press, 1989. – 180 p.)

Посібник адресовано студентам педагогічних університетів і аспірантам гуманітарних спеціаль-ностей.

1. Шкали й вимірювання

Вимірювання – це надання числових форм об’єктам чи подіям у відповідності з певними правилами. С. Стівенс запропонував розподілити

шкали вимірювання на 4 типи:

  • номінативна (номінальна) чи шкала назв;

  • порядкова або ординальна шкала;

  • інтервальна (шкала рівних інтервалів);

  • шкала рівних відношень (пропорцій).

Номінативна шкала це шкала, яка класифікує за назвою (від. nomen (лат.) – ім’я, назва). Ця шкала – це спосіб класифікації об’єктів чи суб’єктів, розподілу їх на певні множини (класи). Ніякий частковий порядок множин не передбачається. В імовірнісному описі явища кожній номінативній шкалі відповідає сукупність попарно несумісних подій, об’єднання який є достовірною подією (простором всіх елементарних подій). Наприклад, або даний індивідуум є дальтоніком, або він не є дальтоніком. Номінативна шкала слугує для підрахунку частот відповідних подій. Одиниця вимірювання – одне спостереження.

Порядкова шкала це спосіб розподілу об’єктів чи суб’єктів на певні множини, для яких можна встановити відношення (лінійного) порядку. Інакше кажучи, можна порівнювати довільні такі множини, встановлюючи відношення “більше” або “менше”. Очевидно, що для змістовної порядкової шкали потрібно не менше трьох класів. Наприклад, реакцію виборців на заяву кандидата у президенти можна назвати позитивною, нейтральною і негатив-ною з очевидним порядком. Класи порядкової шкали можна занумерувати елементами числової множини, на якій вже є певний порядок (наприклад, натуральними числами), причому безліччю способів. Тому відстань між цими числами на числовій прямій визначає “відстані” між елементами класів для порядкової шкали. Одиниця вимірювання – відстань в 1 клас (ранг).

Інтервальна шкала це шкала класифікації за принципом “менше на певну кількість одиниць” і “більше на певну кількість одиниць”.

Шкала рівних відношень – це шкала класи-фікації пропорційно ступеню вираженості певної ознаки.

В імовірнісному описі явища кожній шкалі рівних відношень відповідає випадкова величина, яка вимірюється у стохастичному експерименті, причому мають зміст арифметичні операції (дода-вання, віднімання, множення й ділення) над результатами вимірювання. Такою є, наприклад, шкали вимірювання фізичних величин. Емпіричні частоти подій також можна розглядати в межах шкали рівних відношень.

2. Характеристики емпіричного розподілу

Нехай xj – результат j-го спостереження певної випадкової величини у серії n незалежних спостережень. Позначимо такі величини:

– оцінка математичного сподівання;

– оцінка дисперсії;

– коефіцієнт асиметрії (міра відхилення емпіричного розподілу від симетричного відносно );

– показник ексцесу.

3. Статистичні гіпотези і критерії прийняття гіпотез

Гіпотеза висловлювання про співвідношення між порівнюваними величинами, визначеними в результаті стохастичного експерименту.

Нульова гіпотеза Н0 (як правило) гіпотеза про відсутність відмінностей між порівнюваними величинами.

Альтернативна гіпотеза Н1(як правило) заперечення нульової гіпотези Н0, тобто гіпотеза про значимість відмінностей між порівнюваними величинами. Як правило, це те, що ми прагнемо довести, тому її інколи називають експеримен-тальною гіпотезою.

Нульова і альтернативна гіпотези можуть бути одночасно

або спрямовані (Н0 = (a b), Н1 = (a > b)),

або не спрямовані(Н0 = (a = b), Н1 = (a b)).

Статистичний критерійце алгоритм прий­няття або відхилення гіпотез на основі статистич-них даних (статистик). Статистичні критерії розпо-діляють на:

  • параметричні, які використовують оцінки параметрів розподілу – математичного сподівання і дисперсії;

  • непараметричні, які не використовують оцінки параметрів розподілу.

Рівень значимості критерію — це ймовірність помилки І  роду, тобто помилки відхилення нульо­вої гіпотези Н0 за умови, що вона справ­джу­ється. Історично склалися такі уявлення про низький, достатній і високий рівні статистичної значимості як такі, що не перевищують відповідно 0.05 (5 %), 0,01 (1 %) і 0,001 (0,1 %).

Потужність критерію це ймовірність того, що не зроблено помилку ІІ роду, тобто ймовірність не прийняття нульової гіпотези Н0 за умови, що вона не справджується.

Порівняльну характеристику параметричних і непараметричних критеріїв подано у таблиці 15 додатку.

4. Класифікація задач і методів їх розв’язання

Розв’язання перерахованих далі задач проводять при відповідності критеріїв і умов дослідження, перерахованих у дужках після назв критеріїв.

  1. Виявлення відмінностей на рівні дослід-жуваної ознаки:

  • 2 вибірки – критерій Розенбаума Q (n≥ 11, n≥ 11, n≈ n2), критерій Манна-Уітні (min (n1n2) < 11) або φ*-критерій (кутове перетворення Фішера);

  • 3 і більше вибірок – критерій тенденцій Джонкіра S (n ≤ 10 і с ≤ 6) або критерій Крускала-Уолліса H (n > 10 або с > 6).

2. Визначення зміщення досліджуваної ознаки:

  • 2 вимірювання на одній і тій же вибірці – G-кри-терій знаків (якісні зміщення або кількісні зміщення у вузькому діапазоні), Т-критерій Вілкоксона (кількісні зміщення, які можна впорядкувати за інтенсивністю), або φ*-критерій (кутове перетворення Фішера);

  • 3 і більше вимірюваннь на одній і тій же вибірці – χr2-критерій Фрідмана (n ≤ 12 і c ≤ 6) або L-критерій тенденцій Пейджа (n > 12 або c > 6).

  1. Виявлення відмінностей у розподілі ознаки:

  • порівняння емпіричного і теоретичного розпо-ділів – χ2-критерій Пірсона (довільна шкала), λ-критерій Колмогорова-Смірнова (порядкова шкала) або m-біноміальний критерій (n  50, 2 розряди значень));

  • порівняння двох емпіричних розподілів – χ2-кри-терій Пірсона (довільна шкала), λ-критерій Колмогорова-Смірнова (порядкова шкала) або φ*-критерій (кутове перетворення Фішера, 2 розряди значень).

  1. Виявлення ступеня узгодженості змін двох ознак чи двох ієрархій або профілів – rs-коефіцієнт рангової кореляції Спірмена.

  2. Аналіз змін ознаки під впливом контрольо-ваних умов:

  • під впливом одного фактора – S-критерій тенденцій Джонкіра, L-критерій тенденцій Пейджа або однофакторний дисперсійний аналіз Фішера;

  • під впливом двох факторів – двофакторний дисперсійний аналіз Фішера.

5. Статистичні критерії

Критерії описано у тому ж порядку, в якому подано статистичні таблиці додатку.

    1. Q-критерій Розенбаума.

Призначення: порівняння двох вибірок щодо рівня певної ознаки.

Обмеження: довжини вибірок n1 і n2 більші за 10. Гублер пропонує дотримуватися таких правил:

  • якщо n1 і n2 не перевищують 50, то |n1 n2| не має перевищувати 10;

  • якщо n1 і n2 розташовані в межах від 51 до 100, то |nn2| не має перевищувати 20;

  • якщо n1 і n2 більші за 100, то відношення max (n1n2) / min (n1n2) не має перевищувати 2.

Гіпотези:

Н0рівень ознаки у вибірці 1 не перевищує рівня ознаки у вибірці 2;

Н1рівень ознаки у вибірці 1 перевищує рівень ознаки у вибірці 2.

Алгоритм:

  1. Перевірити допустимість використання критерію (див. обмеження).

  2. Впорядкувати значення ознаки за зростанням у кожній вибірці.

  3. Визначити M2 – найбільше значення ознаки у вибірці 2.

  4. Визначити S1 – кількість значень вибірки 1, які більші за M2.

  5. Визначити m1 – найменше значення ознаки у вибірці 1.

  6. Визначити s2 – кількість значень вибірки 2, які менші за m1.

  7. Обчислюємо Q = S1 + s2.

  8. Якщо max (n1n2) ≤ 26, то за таблицею 1 додатку визначаємо критичне значення Qρ для даних n1 і n2, інакше покладемо Q0,05 = 8, Q0,01 = 10.

  9. Якщо Q ≥ Qρ, то відхиляємо гіпотезу Н0.

5.2. U-критерій Манна-Уітні

Призначення: порівняння двох вибірок щодо рівня певної ознаки з метою визначення, наскільки мала зона спільних значень. Чим менша така зона, тим ймовірніше, що відмінності достовірні. Існує кілька способів використання критерію і відповід-них варіантів таблиць критичних значень.

Обмеження: довжини вибірок n1 і n2 знахо-дяться в межах від 3 до 60.

Гіпотези:

Н0рівень ознаки у вибірці 2 не нижче рівня ознаки у вибірці 1;

Н1рівень ознаки у вибірці 2 нижче рівня ознаки у вибірці 1.

Алгоритм:

  1. Дані вимірювань об’єднуємо в один масив довжини n = n1 + n2 , помітивши, які величини якої вибірки стосуються.

  2. Впорядковуємо утворений масив величин за зростанням.

  3. Кожному результату вимірювання припису-ємо ранг – номер відповідного елемента впорядко-ваного масиву. Якщо кілька вимірювань мають один і той же результат, то всім їм приписуємо ранг, що є середнім арифметичним номерів відповідних елементів впорядкованого масиву. Таким чином, сума рангів усіх результатів вимірю-вання дорівнює n (n + 1) / 2.

  4. Визначаємо за даними вибірок:

  • T1 і T2 – суми рангів відповідно для вибірок 1 і 2;

  • Т = max (T1T2) і номер вибірки x з максимальною сумою рангів – Тx = max (T1T2);

  • U n1n+ nx (nx+1) / 2 – Tx .

Деякі автори рекомендують визначати

U = max (n1nn(n+ 1) / 2 – T1,)

n1nn(n+ 1) / 2 – T2).

  1. Визначаємо за таблицею 2 додатку критичнy величину Uρ (для ρ = 0,05 або ρ = 0,01).

  2. Якщо U Uρ , то приймаємо гіпотезу Н0. Чим менша величина U, тим вища вірогідність відмін-ностей.

5.3. Н-критерій Крускала-Уолліса

Призначення: порівняння трьох і більше вибі­рок щодо рівня певної ознаки. Встановлюють наяв­ність зміни рівня ознаки без виявлення напря­му цих змін.

Обмеження: для встановлення різниці рівнів на високому рівні значимості потрібно, щоб кожна вибірка містила не менше 3 вимірювань. Подана у додатку таблиця 3 містить дані лише для 3-х вибі­рок. Для більшої кількості вибірок і спостережень кожної вибірки можна скористатися таблицею значень критерію χ2, який є асимптотичною грани­цею даного критерію. Кількість степенів свободи ν при цьому на 1 менша за кількість порівнюваних вибірок c: ν = c – 1. При порівнянні багатьох вибі­рок різниця між конкретною парою може бути непомітною. Для попарних порівнянь, кількість яких дорівнює с (с – 1) / 2, використовують крите­рій U або φ*.

Гіпотези:

Н0між вибірками є лише випадкові відмін­ності щодо рівня досліджуваної ознаки;

Н1між вибірками є невипадкові відмінності щодо рівня досліджуваної ознаки.

Алгоритм:

  1. Дані вимірювань об’єднуємо в один масив довжини n = n1 + n2 + ... + nс, помітивши, які вели­чини якої вибірки стосуються.

  2. Впорядковуємо утворений масив величин за зрос­танням.

  3. Кожному результату вимірювання приписує­мо ранг – номер відповідного елемента впорядкова­ного масиву. Якщо кілька вимірювань мають один і той же результат, то всім їм приписуємо ранг, що є середнім арифметичним номерів відповідних еле­ментів впорядкованого масиву. Таким чином, сума рангів усіх результатів вимірювання дорівнює n (n + 1) / 2.

  4. Визначаємо за даними вибірок:

Tj – суми рангів вибірок (j = 1, 2, … , c);

.

  1. Якщо розглядаємо три групи (с = 3) і max{nj}  5, то за таблицею 3 додатку визначаємо критичнy величину Hρ. Інакше покладаємо: Hρ дорів­нює відповідній критичній величині χ2 з кіль­кіс­тю степенів свободи ν = c – 1.

  2. Якщо H Hρ , то відхиляємо гіпотезу Н0.

5.4. S-критерій тенденцій Джонкіра

Призначення: S-критерій використовують для виявлення тенденцій зміни ознаки при переході від однієї вибірки до іншої при порівнянні 3 і більше вибірок.

Обмеження:

  • довжини вибірок n1, n2, ..., nc збігаються і більші за 1;

  • кількість вибірок с більша за 2;

  • для поданої у додатку таблиці 4 кількість ви-бірок с не перевищує 6, а кількість вимірювань nj у кожній вибірці не перевищує 10. Для більших с і nj потрібно скористатися Н критерієм Крускала-Уолліса (див. розділ 5.4).

Гіпотези:

Н0тенденція зростання ознаки при переході від однієї вибірки до іншої є випадковою;

Н1тенденція зростання ознаки при переході від однієї вибірки до іншої не є випадковою.

Алгоритм:

  1. Перевірити статистичні дані щодо можливості використовувати алгоритм. Якщо кількості вимі­рю­вань у вибірках не збігаються, то потрібно випад­ковим чином вибрати підпослідовності вимірювань однакової довжини n з кожної вибірки.

  2. Впорядкувати дані вимірювань для кожної вибірки за зростанням. В результаті отримаємо деяку матрицю (прямокутну таблицю) || ajk ||, де a1k, a2k, a3k,…, ank – результати вимірювання вибірки k, впорядковані за зростанням.

  3. Для кожного елемента ajk в рядку j і стовпчику k знаходимо bjk – кількість елементів цієї матриці, які знаходяться у стовпчиках праворуч від k-го і більші за ajk .

  4. Знаходимо B суму всіх чисел bjk .

  5. Знаходимо різницю 2В і максимального значення B: S = 2B n с (с – 1) / 2.

  6. За таблицею 4 додатку визначаємо критичну величину Sρ для даних кількості вибірок c і кількості спостережень n.

  7. Якщо S Sρ, то відхиляємо H0.

5.5. G-критерій знаків Мак-Немара

Призначення: G-критерій використовують для встановлення напрямку зміщення рівня досліджу­ваної ознаки.

Обмеження: кількість вимірювань, в яких спо­стерігається зміщення рівня ознаки:

  • не менша за 5;

  • не більша за 300 для поданої таблиці 5.

Гіпотези:

Н0переважання типового зміщення є випад­ко­вим;

Н1переважання типового зміщення не є випад-ковим.

Алгоритм:

  1. Вилучимо з вибірок вимірювання, яким відповідає нульове зміщення рівня ознаки і зменшимо кількість спостережень в обох вибірках до певного n.

  2. Визначаємо n+ і n – кількості вимірювань, в яких при переході від однієї вибірки до іншої рівень ознаки зростає і спадає відповідно. Маємо n = n+ + n .

  3. Знайдемо кількість нетипових зміщень

G = min (n+, n).

  1. За таблицею 5 додатку знаходимо критичну величину Gρ для даного n.

  2. Якщо G Gρ, то приймаємо Н1 .

5.6. Т-критерій Вілкоксона

Призначення: Т-критерій порівнює результати вимірювання у двох різних умовах на одній вибірці піддослідних з метою визначення не тільки спрямо­ваності змін ознаки, але і їх інтенсивності.

Обмеження: кількість вимірювань, в яких спосте­­рігається зміщення рівня ознаки:

  • не менша за 5;

  • не більша за 50 для поданої таблиці 6.

Гіпотези:

Н0інтенсивність зміщень у типовому напрям­ку не перевищує інтенсивність зміщень у нетипо­вому напрямку;

Н1інтенсивність зміщень у типовому напрям­ку перевищує інтенсивність зміщень у нетиповому напрямку.

Алгоритм:

  1. Вилучимо з вибірок вимірювання, яким відпо­відає нульове зміщення рівня ознаки і зменшимо кількість спостережень в обох вибірках до певного n.

  2. Дані вимірювань — послідовність трійок чисел: перше і друге вимірювання, різниця між вимірюваннями — впорядкуємо за зростанням абсолютної величини (модуля) різниці вимірювань.

  3. Кожному результату вимірювання припи­су­є­мо ранг — номер відповідного елемента впорядко­ва­ного масиву трійок (див. розділ 5.2).

  4. Знайдемо Т — суму рангів для зміщень у нетиповому напрямку.

  5. За таблицею 6 додатку знаходимо критичну величину Тρ.

  6. Якщо Т Тρ, то приймається гіпотеза Н1 .

5.7. Критерій Фрідмана

Призначення: Критерій використовують для порівняння показників, виміряних у трьох і більше умовах на одній і тій самій вибірці піддослідних.

Обмеження:

  • кількість піддослідних n не менша за 2;

  • кількість вимірювань с не менша за 3.

Гіпотези:

Н0між результатами вимірювань, проведени­ми в різних умовах, є лише випадкові відмінності;

Н1між результатами вимірювань, проведени­ми в різних умовах, відмінності мають невипад­ко­вий характер.

Алгоритм:

  1. Для кожного піддослідного кожному резуль­та­ту вимірювання приписуємо ранг у порядку зростання результату (див. розділ 5.2).

  2. Для j = 1, 2, … , c знаходимо Тj — суму встановлених рангів для результатів вимірювання j.

  3. Знаходимо

  4. Знаходимо критичну величину :

    • якщо c = 3, n ≤ 9, то за таблицею 7А;

    • якщо c = 4, n 4, то за таблицею 7Б;

    • інакше за таблицею 9 критерію χ2 з кількістю степенів свободи ν = с – 1.

  5. Якщо , приймаємо гіпотезу Н1.

5.8. L-критерій Пейджа

Призначення: Критерій виявляє тенденції (напрям) зміни ознаки при переході від однієї умови вимірювання до іншої.

Обмеження:

  • кількість піддослідних n не менша за 2 і для поданих таблиць не перевищує 12;

  • кількість вимірювань с не менша за 3 і для поданих таблиць не перевищує 6.

Гіпотези:

Н0збільшення результатів вимірювань при переході від однієї умови вимірювання до іншої є випадковим;

Н1збільшення результатів вимірювань при переході від однієї умови вимірювання до іншої є невипадковим.

Алгоритм:

  1. Для кожного піддослідного кожному резуль­тату вимірювання приписуємо ранг у порядку зрос­тання результату (див. критерій Манна-Уітні (5.2)). Сума всіх таких рангів для кожного піддослідного дорівнює c(c + 1)/2.

  2. Для j = 1, 2,…, c знаходимо Тj — суму вста­новлених рангів для результатів вимірювання j.

  3. Впорядковуємо умови вимірювання у поряд­ку зростання сум рангів Тj.

  4. Визначаємо .

  5. За таблицею 8 додатку визначаємо критичну величину Lρ для даної кількості піддослідних n і даної кількості умов с.

  6. Якщо L Lρ, приймаємо гіпотезу Н1 .

5.9. 2-критерій Пірсона

Призначення: Критерій застосовують у таких двох випадках:

  • порівняння емпіричного розподілу з певним тео­ретичним;

  • порівняння двох емпіричних розподілів.

Обмеження:

  • довжина вибірки n має бути достатньо великою (хоча б n  30);

  • теоретична частота кожного розряду (проміжку значень) не менша за 5;



Скачать документ

Похожие документы:

  1. Закон великих чисел. Збіжність майже напевно та посилений закон великих чисел. Збіжність випадкових величин за розподілом. Характеристичні функції. Центральна гранична теорема. Випадкові процеси з незалежними приростами

    Закон
    Основні поняття та аксіоми теорії ймовірностей. Ймовірнісні простори та їх приклади. Умовні ймовірності, незалежні події та елементарні ймовірнісні формули.
  2. Законы полового притяжения

    Закон
    с одной стороны оно стремится к понятиям все высшей абстрактности, обнимающих все большую совокупность вещей и в силу этого охватывающих все шире и шире область действительности, с другой стороны, оно направляется к пункту пресечения
  3. Великие арканы таро

    Книга
    О, Египет, Египет! — придет день, когда от твоей религии останется только сказка, сказка невероятная для твоих потомков; сохранятся лишь несколько слов,
  4. Закону України «Про страхування»

    Закон
    актуарій – фізична особа, яка внесена до реєстру актуаріїв у порядку, встановленому уповноваженим органом, і провадить діяльність у сфері страхової та фінансової математики і статистики для визначення зобов'язань страховиків з метою
  5. Великий Мастер всю свою жизнь был счастливым, улыбка всегда озаряла его лицо. Вся его жизнь была пропитана ароматом праздника

    Документ
    Великий Мастер всю свою жизнь был счастливым, улыбка всегда озаряла его лицо. Вся его жизнь была пропитана ароматом праздника! Однажды ученики спросили его:

Другие похожие документы..