1.2 Історичні аспекти використання багатовимірного статистичного аналізу. Методи багатовимірного статистичного аналізу

Багатопараметричний опис об’єктів, явищ і процесів широко використовувався в роботах таких вчених, як:

Ч. Дарвін (60-ті рр. XIX ст., англійський натураліст) у селекції видів і для визначення чинників еволюції органічного світу
Д. І. Менделєєв (60–70 рр. XIX ст.) для систематизації якісних характеристик хімічних елементів
А. П. Шлікевич, І.Ф. Анненський та ін. (початок XX ст.) для класифікації земельних господарств

Історію БСА як самостійного наукового напряму розвитку статистичної теорії пов’язують з публікаціями на початку XX ст. англійських вчених К. Пірсона і У. Спірмена, присвячених основам побудови алгоритмів стиснення статистичних даних. Фундамент теорії БСА заклали такі вчені, як Л.Л. Терстоун, Л.Р. Такер, Р. Хорст, Г. Кайзер, Т. Келлі, Г. Харман, Р. Тріонон, Р. Сокал, М. Жамбю, Р.В. Хемінг, Л. Заде, Р. Фішер та ін. (рис. 1.2).

Вчені-теоретики, які заклали фундамент теорії БСА

Рис. 1.2: Вчені-теоретики, які заклали фундамент теорії БСА

Методи багатовимірного статистичного аналізу базуються на методах статистики (теорія ймовірностей, математична статистика, загальна теорія статистики) та методах вищої математики (аналітична геометрія, матрична алгебра, багатомірний математичний аналіз) і використовують методи ймовірнісного аналізу даних і методи логіко-геометричного напряму (рис. 1.3).

Методи багатовимірного статистичного аналізу

Рис. 1.3: Методи багатовимірного статистичного аналізу

Методи та задачі багатовимірного статистичного аналізу

У бізнес-аналізі багатовимірних процесів виникають різні задачі, для дослідження та розв’язання яких застосовують відповідні методи (табл. 1.1).

Табл. 1.1: Методи та задачі багатовимірного статистичного аналізу
Методи Типи задач Коментарі
Статистичного оцінювання багатовимірної випадкової величини Оцінка параметрів багатовимірної сукупності Оцінка: багатовимірної середньої, матриці коваріацій, імовірнісних оцінок, робастне оцінювання
Перевірка багатовимірних гіпотез Перевірка гіпотез про рівність параметрів багатовимірних сукупностей і відповідність законам розподілу -
Множинний кореляційно-регресійний аналіз Вимірювання і моделювання зв’язків досліджуваних ознак або об’єктів -
Багатовимірне шкалювання Візуалізація даних, моделювання складних систем Подання даних у теоретичному просторі; опис процесів і явищ, які через свою складність або нестабільність не піддаються моделюванню традиційними методами
Метод головних компонент (факторний аналіз) Стиснення даних Зведення множини елементарних ознак до малої кількості значущих «узагальнених ознак» і виявлення латентних факторів. Це ж завдання може вирішуватися відносно не тільки ознак, але й об’єктів
Багатовимірне групування (кластерний аналіз) Групування багатовимірних об’єктів Групування багатовимірних об’єктів
Дискримінантний аналіз Угрупування з «навчанням» Пошук еталонних груп, класифікація нових об’єктів за відомими еталонними групами
Канонічних кореляцій Стиснення даних і моделювання зв’язків узагальнених ознак Установлюється форма зв’язку наборів залежних змінних з незалежними факторними змінними, які можуть бути узагальненими ознаками
Багатовимірний дисперсійний аналіз Оцінювання та дослідження дисперсій комплексів ознак -
Багатовимірний коваріаційний аналіз Оцінювання залежності варіації результативної ознаки від факторної Передбачає попередню класифікацію даних і пошук регресійних зв’язків для кожного класу. Потім обчислюються і аналізуються оцінки коваріацій \((T_{xx}\), \(T_{yy}\), \(T_{yx})\)

Отже, методи багатовимірного статистичного аналізу дозволяють розв’язувати різноманітні задачі дослідження багатовимірних процесів: групування, стиснення даних, моделювання складних систем, оцінювання параметрів багатовимірних сукупностей та ін. Це дозволяє використовувати отримані результати для прийняття ефективних управлінських рішень.