9.1 Оцінка параметрів розподілу випадкових величин
- Мета
- Закріплення теоретичного та практичного матеріалу з оцінювання параметрів розподілу випадкових величин; набуття навичок роботи в модулі
Basic Statistics / Tables.
- Завдання
- Необхідно провести аналіз варіаційного ряду для вибіркових даних у модулі
Basic Statistics / Tables ППП Statistica:- Розрахувати статистичні характеристики ряду (середнє, дисперсію, середнє квадратичне відхилення, моду, медіану, розмах варіації, коефіцієнти асиметрії та ексцесу).
- Побудувати гістограму та полігон розподілу випадкової величини, зробити висновки щодо характеру закону розподілу.
- За допомогою критеріїв Пірсона та Колмогорова-Смірнова перевірити гіпотезу про нормальний закон розподілу.
- Зробити висновки щодо групування об’єктів за величиною відповідного показника.
Література: [5–9; 14; 41–44; 48; 49; 76].
Методичні рекомендації
Для розв’язання та аналізу задач розглядуваного типу в ППП Statistica передбачений модуль Basic Statistics / Tables (Основні статистики й таблиці). Розглянемо порядок роботи в даному модулі.
У меню програм слід вибрати програму Statistica, після її запуску виберіть у меню пункт File / New для підготовки власних даних. Перед вами з’явиться діалогове вікно, у якому необхідно вказати кількість змінних (Number of variables) і кількість випадків (Number of Cases). Після введення натисніть кнопку вікна OK (рис. 9.1).
Рис. 9.1: Визначення кількості змінних і спостережень
Перед вами з’явиться порожнє поле, що містить таблицю розміром 25×2: 25 спостережень, 2 змінні (рис. 9.2). Кожен елемент даних, тобто значення показника, займає одну комірку поля даних.
Рис. 9.2: Поле даних
Після заповнення всіх комірок поля даних ви отримаєте таблицю, наведену на рис. 9.3.
Рис. 9.3: Вихідні дані
Розрахуємо основні статистичні характеристики ряду (середнє, дисперсію, середнє квадратичне відхилення, моду, медіану, розмах, коефіцієнти асиметрії й ексцесу).
Щоб почати обчислювальні процедури, необхідно ввійти в позицію меню Statistics / Basic Statistics / Tables (рис. 9.4).
Рис. 9.4: Вибір модуля
Після підтвердження вибору модуля перед вами з’явиться діалогове вікно, що дозволяє задати напрям аналізу Descriptive statistics (Описові статистики), подане на рис. 9.5.
Рис. 9.5: Вибір напряму аналізу
Після вибору напряму аналізу з’явиться стартова панель модуля, де необхідно задати вихідні параметри: Variable (Змінні) та відповідний набір процедур для подальшого аналізу (рис. 9.6).
Рис. 9.6: Стартова панель модуля
Ініціюйте кнопку Variable (Змінні) й у вікні, що з’явилося, укажіть показники, за якими здійснюється аналіз. Після зазначення змінних підтвердіть свій вибір натисканням кнопки ОК. Далі, ініціювавши вкладиш Advanced, необхідно виділити основні статистики для розрахунку (рис. 9.7).
Рис. 9.7: Вибір описових статистик
Такими є: Valid N (кількість спостережень), Mean (середнє), Sum (сума значень), Median (медіана), Mode (мода), Standard Deviation (середнє квадратичне відхилення), Variance (дисперсія), Skewness (коефіцієнт асиметрії), Kurtosis (коефіцієнт ексцесу), Min & Max (мінімум і максимум), Range (розмах вибірки). Результати розрахунку описових статистик для даної вибірки отримуємо натисканням клавіші Summary (рис. 9.8).
Рис. 9.8: Описові статистики
Побудуємо гістограму та полігон розподілу випадкової величини; проведемо групування вибірки. Для наочності подання досліджуваної сукупності побудуємо полігон розподілу. Для цього необхідно зайти в меню Graphs / 2D Graphs / Scaterplots (рис. 9.9), вибрати змінні та задати параметри графіка (рис. 9.10) і побудувати полігон розподілу випадкової величини (рис. 9.11).
Рис. 9.9: Вибір типу графіка
Рис. 9.10: Вибір параметрів графіка
Рис. 9.11: Полігон розподілу випадкової величини
Подальший аналіз здійснюється в рамках перевірки вибірки на нормальний закон розподілу. Для проведення групування вибірки в стартовій панелі модуля вибираємо вкладиш Normality, де можна задавати бажану кількість інтервалів і критерій Колмогорова-Смірнова для тестування вибірки (рис. 9.12).
Рис. 9.12: Вибір параметрів групування випадкової величини
Натиснувши клавішу Frequency tables (Таблиці частот), отримуємо наступну таблицю (рис. 9.13).
Рис. 9.13: Результат групування вибірки
Як видно, вихідна сукупність із двадцяти п’яти банків розбита на сім інтервалів. У кожному інтервалі розраховані такі характеристики: Count (частота), Cumulative Count (накопичена частота), Percent of Valid (% від загальної частоти), Cumul % of Valid (накопичений % від загальної частоти), % of all Cases (% від загального числа спостережень), Cumulative % of all Cases (накопичений % від загального числа спостережень), Expected Count (теоретична частота), Cumulative Expected (накопичена теоретична частота), % Expected (% від загальної теоретичної частоти), Cumulative % Expected (накопичений % від загальної теоретичної частоти).
Натиснувши клавішу Histograms (вкладиш Normality), створимо наступну гістограму розподілу з накладеною кривою нормального закону розподілу (рис. 9.14).
Рис. 9.14: Гістограма розподілу
Подальший аналіз вибірки передбачає розрахунок критерію Пірсона та Колмогорова-Смірнова для формування відповідних висновків про характер закону розподілу. Для визначення характеру закону розподілу та його відповідності нормальному закону дослідимо за допомогою графіків порівняння емпіричних і теоретичних частот і накопичених частот. Вихідні дані для побудови графіків та розраховані значення критерію Пірсона та Колмогорова-Смірнова наведені на рис. 9.15.
Рис. 9.15: Аналіз закону розподілу випадкової величини
Для побудови графіків інтервальних значень частоти розподілу досліджуваної сукупності необхідно зайти в меню Graphs / 2D Graphs / Scaterplots, вибрати змінні та задати параметри графіка (рис. 9.16).
Рис. 9.16: Вибір змінних для побудови графіків
На рис. 9.17 і рис. 9.18 наведені графіки порівняння емпіричних і теоретичних частот і накопичених емпіричних і теоретичних частот, які дозволяють зробити висновки про відповідність нормальному закону розподілу та визначити розбіжність частот у кожному з досліджуваних інтервалів.
Рис. 9.17: Графік порівняння емпіричних і теоретичних частот
Рис. 9.18: Графік порівняння накопичених емпіричних і теоретичних частот
Далі робимо висновки про угрупування даних об’єктів за величиною показника % доходу. Порівнюємо отримані значення з табличними за відповідними критеріями та робимо висновки про характер закону розподілу.