При використанні методів математичної статистики надзвичайно важливо знати закон розподілу властивості, що вивчається. По суті, вже сама досліджувана змінна представлена масивом емпіричних даних з певним законом розподілу ймовірностей реалізації її значень. Тому будь-яка статистична обробка починається, як правило, зі спроби оцінити закон розподілу. Прагнення застосувати методи, які розроблено для певного закону розподілу, в умовах, коли реальний розподіл відрізняється від гіпотетичного, є найбільш розповсюдженою помилкою, що призводить у підсумку і до помилкових висновків.
Критерії перевірки гіпотез щодо закону розподілу прийнято називати критеріями згоди, які можна розділити на дві групи: загальні та спеціальні [37, С. 20]. Загальні критерії застосовують до формулювань гіпотез про згоду спостережень з будь-яким можливим розподілом. Спеціальні критерії згоди використовують у разі перевірки гіпотези щодо конкретної форми розподілу - нормальної, рівномірної, експоненціальної тощо. Такі критерії носять відповідну назву - критерії нормальності, критерії рівномірності й т.п.
Розрахунки емпіричного розподілу та його графічна візуалізація не дають надійних підстав для висновку щодо закону розподілу ознаки у сукупності, з якої взята вибірка. Тим часом знання цього закону є необхідною умовою використання багатьох математичних методів. Наприклад, застосування параметричних критеріїв, дисперсійного аналізу вимагає попередньої перевірки нормальності розподілу досліджуваної ознаки.
Серед методів оцінювання законів розподілу ймовірностей випадкових величин біля двох десятків було спеціально розроблено для перевірки нормальності. Найбільш розповсюдженими вважаються критерії асиметрії й ексцесу, хі-квадрат та ін. Проте варто рекомендувати критерій Шапіро-Вілка У¥, який за рейтингом потужності посідає перше місце [37, С 278]. Розглянемо методику, техніку й особливості використання трьох критеріїв: асиметрії й ексцесу, хі-квадрат і Шапіро-Вілка. Причому для порівняння будемо використовувати у навчальних прикладах одні й ті самі емпіричні дані.
Критерії асиметрії та ексцесу
Критерій згоди х2
Критерій х засновано на порівнянні емпіричної гістограми розподілу випадкової величини з її теоретичною щільністю. Діапазон виміряних емпіричних даних розбивають на к інтервалів і розраховують статистику
2 _ -у (ті - прі)2
Хемп ~ / < ,(5.7)
,=1 пр,
де ті - кількість значень випадкової величини, що потрапили в /-й інтервал; п - обсяг вибірки; рі - теоретична ймовірність випадкової величини потрапити в /-й інтервал.
Для гіпотетичного теоретичного розподілу, який має закон розподілу Р(х), теоретична ймовірність рі визначається якрі = Р(хІ+1) - Р(х,), тобто
рі = |Р(х)ах = |Р(х)<1х - |Р(х)ах = Р(х,+1) - Р(хі). (5.8)
V 1 2
За умов к<<п і 2-і - <<п вважається, що статистика %емпмає розподіл
близький до розподілу хі-квадрат для к-1 ступенів вільності. Нульова гіпотеза Н0 відхиляється на рівні значущості а, якщо хімп > ХІі.
Приклад 5.3. Перевірити за критерієм згоди % гіпотезу про нормальний розподіл емпіричних даних попереднього прикладу 5.2. Послідовність рішення: o Формулювання гіпотез:
Н0: емпіричний розподіл не відрізняється від нормального; Ні: емпіричний розподіл відрізняється від нормального.
o Статистичний критерій хімп дорівнює сумі квадратів відхилень емпіричних частот Ші від очікуваних теоретичних частот прі (5.7).
Сторінки
В нашій електронній бібліотеці ви можете безкоштовно і без реєстрації прочитати «Математична статистика» автора Руденко В.М. на телефоні, Android, iPhone, iPads. Зараз ви знаходитесь в розділі „5.2. ГІПОТЕЗИ ЩОДО НОРМАЛЬНОГО РОЗПОДІЛУ ОЗНАК“ на сторінці 1. Приємного читання.