9.1 Оцінка параметрів розподілу випадкових величин
- Мета
- Закріплення теоретичного та практичного матеріалу з оцінювання параметрів розподілу випадкових величин; набуття навичок роботи в модулі
Basic Statistics / Tables
.
- Завдання
- Необхідно провести аналіз варіаційного ряду для вибіркових даних у модулі
Basic Statistics / Tables ППП Statistica
:- Розрахувати статистичні характеристики ряду (середнє, дисперсію, середнє квадратичне відхилення, моду, медіану, розмах варіації, коефіцієнти асиметрії та ексцесу).
- Побудувати гістограму та полігон розподілу випадкової величини, зробити висновки щодо характеру закону розподілу.
- За допомогою критеріїв Пірсона та Колмогорова-Смірнова перевірити гіпотезу про нормальний закон розподілу.
- Зробити висновки щодо групування об’єктів за величиною відповідного показника.
Література: [5–9; 14; 41–44; 48; 49; 76].
Методичні рекомендації
Для розв’язання та аналізу задач розглядуваного типу в ППП Statistica передбачений модуль Basic Statistics / Tables
(Основні статистики й таблиці). Розглянемо порядок роботи в даному модулі.
У меню програм слід вибрати програму Statistica
, після її запуску виберіть у меню пункт File / New
для підготовки власних даних. Перед вами з’явиться діалогове вікно, у якому необхідно вказати кількість змінних (Number of variables
) і кількість випадків (Number of Cases
). Після введення натисніть кнопку вікна OK
(рис. 9.1).

Рис. 9.1: Визначення кількості змінних і спостережень
Перед вами з’явиться порожнє поле, що містить таблицю розміром 25×2: 25 спостережень, 2 змінні (рис. 9.2). Кожен елемент даних, тобто значення показника, займає одну комірку поля даних.

Рис. 9.2: Поле даних
Після заповнення всіх комірок поля даних ви отримаєте таблицю, наведену на рис. 9.3.

Рис. 9.3: Вихідні дані
Розрахуємо основні статистичні характеристики ряду (середнє, дисперсію, середнє квадратичне відхилення, моду, медіану, розмах, коефіцієнти асиметрії й ексцесу).
Щоб почати обчислювальні процедури, необхідно ввійти в позицію меню Statistics / Basic Statistics / Tables
(рис. 9.4).

Рис. 9.4: Вибір модуля
Після підтвердження вибору модуля перед вами з’явиться діалогове вікно, що дозволяє задати напрям аналізу Descriptive statistics
(Описові статистики), подане на рис. 9.5.

Рис. 9.5: Вибір напряму аналізу
Після вибору напряму аналізу з’явиться стартова панель модуля, де необхідно задати вихідні параметри: Variable
(Змінні) та відповідний набір процедур для подальшого аналізу (рис. 9.6).

Рис. 9.6: Стартова панель модуля
Ініціюйте кнопку Variable
(Змінні) й у вікні, що з’явилося, укажіть показники, за якими здійснюється аналіз. Після зазначення змінних підтвердіть свій вибір натисканням кнопки ОК
. Далі, ініціювавши вкладиш Advanced
, необхідно виділити основні статистики для розрахунку (рис. 9.7).

Рис. 9.7: Вибір описових статистик
Такими є: Valid N
(кількість спостережень), Mean
(середнє), Sum
(сума значень), Median
(медіана), Mode
(мода), Standard Deviation
(середнє квадратичне відхилення), Variance
(дисперсія), Skewness
(коефіцієнт асиметрії), Kurtosis
(коефіцієнт ексцесу), Min & Max
(мінімум і максимум), Range
(розмах вибірки). Результати розрахунку описових статистик для даної вибірки отримуємо натисканням клавіші Summary
(рис. 9.8).

Рис. 9.8: Описові статистики
Побудуємо гістограму та полігон розподілу випадкової величини; проведемо групування вибірки. Для наочності подання досліджуваної сукупності побудуємо полігон розподілу. Для цього необхідно зайти в меню Graphs / 2D Graphs / Scaterplots
(рис. 9.9), вибрати змінні та задати параметри графіка (рис. 9.10) і побудувати полігон розподілу випадкової величини (рис. 9.11).

Рис. 9.9: Вибір типу графіка

Рис. 9.10: Вибір параметрів графіка

Рис. 9.11: Полігон розподілу випадкової величини
Подальший аналіз здійснюється в рамках перевірки вибірки на нормальний закон розподілу. Для проведення групування вибірки в стартовій панелі модуля вибираємо вкладиш Normality
, де можна задавати бажану кількість інтервалів і критерій Колмогорова-Смірнова для тестування вибірки (рис. 9.12).

Рис. 9.12: Вибір параметрів групування випадкової величини
Натиснувши клавішу Frequency tables
(Таблиці частот), отримуємо наступну таблицю (рис. 9.13).

Рис. 9.13: Результат групування вибірки
Як видно, вихідна сукупність із двадцяти п’яти банків розбита на сім інтервалів. У кожному інтервалі розраховані такі характеристики: Count
(частота), Cumulative Count
(накопичена частота), Percent of Valid
(% від загальної частоти), Cumul % of Valid
(накопичений % від загальної частоти), % of all Cases
(% від загального числа спостережень), Cumulative % of all Cases
(накопичений % від загального числа спостережень), Expected Count
(теоретична частота), Cumulative Expected
(накопичена теоретична частота), % Expected
(% від загальної теоретичної частоти), Cumulative % Expected
(накопичений % від загальної теоретичної частоти).
Натиснувши клавішу Histograms
(вкладиш Normality), створимо наступну гістограму розподілу з накладеною кривою нормального закону розподілу (рис. 9.14).

Рис. 9.14: Гістограма розподілу
Подальший аналіз вибірки передбачає розрахунок критерію Пірсона та Колмогорова-Смірнова для формування відповідних висновків про характер закону розподілу. Для визначення характеру закону розподілу та його відповідності нормальному закону дослідимо за допомогою графіків порівняння емпіричних і теоретичних частот і накопичених частот. Вихідні дані для побудови графіків та розраховані значення критерію Пірсона та Колмогорова-Смірнова наведені на рис. 9.15.

Рис. 9.15: Аналіз закону розподілу випадкової величини
Для побудови графіків інтервальних значень частоти розподілу досліджуваної сукупності необхідно зайти в меню Graphs / 2D Graphs / Scaterplots
, вибрати змінні та задати параметри графіка (рис. 9.16).

Рис. 9.16: Вибір змінних для побудови графіків
На рис. 9.17 і рис. 9.18 наведені графіки порівняння емпіричних і теоретичних частот і накопичених емпіричних і теоретичних частот, які дозволяють зробити висновки про відповідність нормальному закону розподілу та визначити розбіжність частот у кожному з досліджуваних інтервалів.

Рис. 9.17: Графік порівняння емпіричних і теоретичних частот

Рис. 9.18: Графік порівняння накопичених емпіричних і теоретичних частот
Далі робимо висновки про угрупування даних об’єктів за величиною показника % доходу. Порівнюємо отримані значення з табличними за відповідними критеріями та робимо висновки про характер закону розподілу.