2.3 Сутність та основи робастного оцінювання вибірки

У процесі дослідження статистичних сукупностей часто спостерігаються дані, що різко відхиляються від основного масиву, тобто є похибками, або «викидами».

У ході виявлення подібних похибок («викидів») виникають такі запитання: чи дійсно ці дані є похибками (наприклад, реєстрації), або це реальні значення; як отримати адекватні оцінки для параметрів досліджуваної сукупності? Дослідження цих питань відбувається у спеціальному розділі економіко-статистичних методів — робастному (стійкому) оцінюванні. Основи робастних методів оцінювання інформації були розроблені академіками: А. Н. Колмогоровим, Н. В. Смирновим, Б. С. Ястремським. Подальший розвиток методи отримали в роботах американського статистика Д. Тьюкі та швейцарського математика П. Хубера.

Методи робастного оцінювання
це статистичні методи, які дозволяють отримати досить надійні оцінки статистичної сукупності з урахуванням неявності закону розподілу та наявності значних відхилень у даних.

У вирішенні задач робастного оцінювання у статистичній сукупності виділяють два типи даних (рис. 2.7).

Типи даних у статистичній сукупності

Рис. 2.7: Типи даних у статистичній сукупності

У практиці стійкого оцінювання виділяють такі основні причини наявності грубих помилок (рис. 2.8).

Основні причини наявності грубих помилок

Рис. 2.8: Основні причини наявності грубих помилок

Алгоритм обробки «грубих похибок» включає такі основні кроки (рис. 2.9):

Алгоритм обробки «грубих похибок»

Рис. 2.9: Алгоритм обробки «грубих похибок»

Виявлення «грубих похибок» і оцінювання їх ступеня можливі за допомогою візуального аналізу даних або перевірки статистичної гіпотези на наявність похибок. Більш глибокий аналіз передбачає розрахунок спеціальних статистичних критеріїв.