Таблиця 6
_Рекомендоване число груп для різної кількості спостережень_
Кількість одиниць спостережень | Рекомендоване число інтервалів (груп) |
до 40 | 3-5 |
40-60 | 6-8 |
60-100 | 8-10 |
100-200 | 10-12 |
200-500 | 12-17 |
Якщо число одиниць спостереження налічується до 40, число інтервалів становитиме 3 або 5. Розподіл сукупності на 4 групи небажаний, адже в такому випадку втрачається середня група (інтервал).
Перевага рекомендації В. П. Левинського у порівнянні з рекомендацією Стерджесса у тому, що вона не так жорстко пов'язує число груп з чисельністю одиниць спостереження. А в такому разі дослідникові надається можливість певного вибору числа груп залежно від характеру сукупності. В економічних дослідженнях найбільш поширений обсяг сукупності 100-500 одиниць. За формулою Стерджесса число груп дорівнюватиме 7-10, за рекомендацією В. П. Левинського - від 10 до 17 груп.
Слід пам'ятати, що кількість обраних інтервалів (груп) залежить від коливності групувальної ознаки: чим воно більше, тим більше треба утворювати груп. Треба також намагатися, щоб виділені групи були достатньо заповнені одиницями спостереження. Наявність незаповнених Інтервалів або потрапляння в них лише окремих одиниць сукупності - результат того, що невдало обрано інтервали, кількість їх взята, ймовірно, зайва. Наявність малонаповнених інтервалів (груп) має право на існування лише по краях групування, де концентруються характеристики як передових, так і відстаючих показників за розміром відносно середнього рівня. Особливо це стосується структурних групувань. Кількість груп тут не повинна бути досить великою чи досить малою. У першому випадку є ризик загубитися у дрібницях, у другому - не виявити досить важливі властивості досліджуваної сукупності. Оптимальна кількість інтервалів дозволяє викрити всі істотні особливості досліджуваної сукупності.
Отже, якщо вирішено питання про визначення числа груп, на яке буде поділена сукупність, вихідні варіанти розташовують у ранжирований ряд за групувальною ознакою. В умовах відсутності ускладнюючих обставин, тобто наявності порівно поступових змін факторної ознаки, найпростішим способом визначення величини інтервалу при побудові рівновеликих інтервалів буде відношення:
х - X ■ і =-,
п
де і - величина інтервалу; хтах і хтіп - відповідно максимальна і мінімальна варіанти; п - задане число груп (інтервалів).
У випадках, коли невелика частина сукупності значно віддалена за розміром групувальної ознаки від сукупності основного масиву, за хтах приймається максимальна варіанта основного масиву.
Існують рекомендації щодо встановлення величини інтервалу групувань з деякими поправками до попередньої формули. У цьому
х - X ■ + 1
і =-
випадку формула набуває вигляду: " .
У випадках, коли максимальне і мінімальне значення у ранжированому ряду групувальних ознак значно відрізняється від решти показників, за хтах приймається суміжне наступне значення ознаки хтах+1, а за хтіп суміжне попереднє її значення хтіп-1.
У ряді випадків вихідна величина інтервалу групувань задається
х - X ■
. . . -=п
дослідником, а число груп у такому разі є похідним, тобто: 1
Якщо розрахована величина рівного інтервалу становить
Сторінки
В нашій електронній бібліотеці ви можете безкоштовно і без реєстрації прочитати «Статистика» автора Опря А.Т. на телефоні, Android, iPhone, iPads. Зараз ви знаходитесь в розділі „ТЕМА 3. ЗВЕДЕННЯ І ГРУПУВАННЯ СТАТИСТИЧНИХ ДАНИХ“ на сторінці 6. Приємного читання.