8.3 Метод головних факторів. Оцінювання факторів і задачі класифікації

Алгоритм методу головних факторів:

  1. Розрахунок матриці парних коефіцієнтів кореляції з одиницями на головній діагоналі.
  2. Визначення спільності та знаходження матриці \(R_h\) зі спільностями на головній діагоналі.
  3. Визначення першого загального фактора за умови, щоб його внесок у дисперсію процесу \(v_1\) був максимальним:

\[ v_1 = \bar{a}_1 \bar{a}_1 = \sum_{j=1}^n a_{j1}^2 = \max. \tag{8.12} \] Умови, за яких має бути забезпечено максимум, описують формулою:

\[ r_{jk} = \sum_{r=1}^m a_{jr} a_{jk}, (j, k = \overline{1, n}). \] \[ \begin{cases}(h_1^2 - \lambda) a_{11} + r_{12} a_{21} + ... + r_{1n} a_{n1} = 0 \\ r_{21} a_{11} + (h_2^2 - \lambda) a_{21} + ... + r_{2n} a_{n1} = 0 \\ r_{n1} a_{11} + r_{n2} a_{21} + ... + (h_n^2 - \lambda) a_{n1} = 0 \end{cases} \> \> \> \begin{vmatrix} (h_1^2 - \lambda) & ... & r_{1n} \\ ... & ... & ... \\ r_{n1} & ... & (h_n^2 - \lambda) \end{vmatrix} = 0. \] Визначник матриці коефіцієнтів цієї системи рівнянь \(Q\) має дорівнювати нулю.

  1. Знаходження найбільшого власного числа \(λ\) і його власного вектора визначають перший загальний фактор, що має максимальний внесок в дисперсію. Значення відповідних елементів матриці \(A\) розраховують за формулою: \[ a_{j1} = \frac{a_{j1} \sqrt{\lambda_1}}{\sqrt{a_{11} + ... + a_{n1}}}, \> \lambda_1 = \sum_{j=1}^n a_{j1}^2, \tag{8.13} \] де \(α_{11}, … α_{n1}\) — значення відповідного власного вектора.

Таким чином, отриманий перший загальний фактор, вагові коефіцієнти якого забезпечили йому максимальний внесок в сумарну спільність.

  1. Знаходження другого загального фактора, який забезпечує максимальний внесок у сумарну дисперсію. Тут замість матриці \(R\) використовують матрицю залишків, яка дорівнює: \[ R_1 = R_h - R^1 = R_h - a_1 a_1^T. \tag{8.14} \]

  2. Знаходження інших загальних факторів.

  3. Числові значення факторів розраховуються за формулою: \[ F = Λ^{-1} A^T Y, Λ = A^T A. \tag{8.15} \]

Оцінка значущості моделі ФА визначається критерієм Бартлетта (перевіряється нульова гіпотеза, що виділеної кількості факторів достатньо для пояснення вибіркових коефіцієнтів кореляції). Для статистичної перевірки гіпотез знаходять розрахункове значення:

\[ \chi^2 = Nln \frac{|AA^T|}{R}, \tag{8.16} \]

де \(|AA^T|\) — визначник відтвореної матриці кореляцій;

\(|R|\) — визначник вихідної кореляційної матриці;

\(N\) — кількість об’єктів дослідження.

Якщо обчислене значення більше табличного з вибраним рівнем значущості \((χ^2>χ_T^2)\) і число ступенів свободи, що дорівнює

\[ v = \frac{1}{2}[(n-m)^2 - n - m], \tag{8.17} \]

де \(n\) — кількість змінних;

\(m\) — кількість виділених загальних факторів;

то нульова гіпотеза відхиляється. Тоді слід додати ще один фактор і повторити процедуру перевірки.

Інтерпретація отриманих факторів. Після того, як виділені головні фактори або головні компоненти, їх слід інтерпретувати. Принцип інтерпретації факторів: якщо під час аналізу матриці факторних навантажень установлено, що кожен їх головний фактор має помітно великі навантаження на своїй групі ознак, то інтерпретація факторів визначається виділеними таким чином групами ознак. У разі, коли не вдається пояснити сформовану систему факторів, вдаються до процедури обертання.

Проблема обертання. Подання всіх змінних у просторі загальних факторів або головних компонент у вигляді сукупності векторів називають конфігурацією (рис. 8.3).

Конфігурація факторів

Рис. 8.3: Конфігурація факторів

Мета процедур обертання — отримання простої структури, за якої більшість спостережень знаходилась би поблизу координатних осей. Розглянемо приклад методу головних факторів.

Приклад

Задано матрицю стандартизованих вхідних даних (табл. 8.2).

Табл. 8.2: Вхідні дані
№ п/п \(Y_1\) \(Y_2\) \(Y_3\) \(Y_4\) \(Y_5\) \(Y_6\)
1 0,30 0,04 0,69 0,20 0,23 0,56
2 0,76 0,10 0,57 0,62 0,42 0,52
3 1,36 0,62 1,56 1,27 0,23 2,02
4 0,22 1,43 0,97 0,30 1,92 0,16
5 1,15 0,63 0,57 1,11 0,03 0,38
6 1,04 1,47 0,69 1,28 1,01 0,40

Змінні: \(y_1\) — безробіття; \(y_2\) — імпорт; \(y_3\) — експорт; \(y_4\) — інфляція; \(y_5\) — ставка депозитів; \(y_6\) — податок на прибуток.

Розв’язання

  1. Знаходження матриці парних кореляцій. \[ R = \left(\begin{array}{r}1,00 & 0,03 & 0,32 & \bf{0,96} & -0,53 & 0,60 \\ 0,03 & 1,00 & 0,17 & 0,30 & \bf{0,77} & -0,24 \\ 0,32 & 0,17 & 1,00 & 0,28 & 0,07 & \bf{0,84} \\ \bf{0,96} & 0,30 & 0,28 & 1,00 & -0,32 & 0,46 \\ -0,53 & \bf{0,77} & 0,07 & -0,32 & 1,00 & -0,44 \\ 0,60 & -0,24 & \bf{0,84} & 0,46 & -0,44 & 1,00 \end{array}\right). \]

  2. Визначення матриці \(R_h\) зі спільностями на головній діагоналі методом найбільшого елемента на рядку. \[ R_h = \left(\begin{array}{r} \bf{0,96} & 0,03 & 0,32 & 0,96 & -0,53 & 0,60 \\ 0,03 & \bf{0,77} & 0,17 & 0,30 & 0,77 & -0,24 \\ 0,32 & 0,17 & \bf{0,84} & 0,28 & 0,07 & 0,84 \\ 0,96 & 0,30 & 0,28 & \bf{0,96} & -0,32 & 0,46 \\ -0,53 & 0,77 & 0,07 & -0,32 & \bf{0,77} & -0,44 \\ 0,60 & -0,24 & 0,84 & 0,46 & -0,44 & \bf{0,84} \end{array}\right). \]

  3. Визначення першого загального фактора за умови, що його внесок у сумарну дисперсію максимальний. Для цього знаходимо власні числа і власні вектори матриці \(R_h\).

\(\lambda_1\) \(\lambda_2\) \(\lambda_3\) \(\lambda_4\) \(\lambda_5\) \(\lambda_6\)
2,869 1,574 1,049 0,039 0,177 0,147

Графічне зображення власних чисел у порядку зменшення має назву «Графік кам’янистого осипу» (рис. 8.4).

Графік кам’янистого осипу

Рис. 8.4: Графік кам’янистого осипу

Як видно з графіка, першому загальному фактору відповідає перше власне значення матриці \(R_h\), оскільки воно є максимальним.

  1. Обираємо максимальне власне число та власний вектор і розраховуємо значення відповідного першому загальному фактору стовпця матриці вагових коефіцієнтів \(A\), використовуючи формулу 8.13. \[ a_1 = \begin{array}{r}0,919545 \\ -0,122197 \\ 0,577716 \\ 0,818082 \\ -0,555222 \\ 0,835092 \end{array}. \]

  2. Знаходження другого загального фактора. Для цього замість матриці \(R_h\) використовується матриця залишків, яка дорівнює: \[ R_1 = R_h - R^1 = R_h - a_1 a_1^T \] \[ \left(\begin{array}{r} 0,11 & 0,15 & -0,21 & 0,20 & -0,02 & -0,17 \\ 0,15 & 0,75 & 0,24 & 0,40 & 0,70 & -0,14 \\ -0,21 & 0,24 & 0,51 & -0,20 & 0,39 & 0,36 \\ 0,20 & 0,40 & -0,20 & 0,29 & 0,13 & -0,22 \\ -0,02 & 0,70 & 0,39 & 0,13 & 0,46 & 0,03 \\ -0,17 & -0,14 & 0,36 & -0,22 & 0,03 & 0,15 \end{array}\right). \]

  3. Повторюючи процедури 3–5 знаходимо всі необхідні загальні фактори. Матриця вагових коефіцієнтів \(A\):

\(F_1\) \(F_2\) \(F_3\)
\(x_1\) 0,9195 0,0724 -0,3600
\(x_2\) -0,1222 0,8934 -0,1820
\(x_3\) 0,5777 0,3817 0,6494
\(x_4\) 0,8181 0,3095 -0,4696
\(x_5\) -0,5552 0,7268 0,1400
\(x_6\) 0,8351 -0,0331 0,4737

Шляхом перевірки за критерієм Бартлетта було встановлено, що виділення трьох загальних факторів достатньо. До того ж висновку можна було прийти, проаналізувавши графік «кам’янистого осипу», звідки видно, що значення перших трьох власних чисел значно більше за інші. Інтерпретація факторів проводиться шляхом аналізу вагових коефіцієнтів (чим ближче до одиниці, тим більше вплив фактора на показник). Очевидно, що перший фактор має найбільший зв’язок з 1, 4 і 6 показниками. Отже, їх доцільно розглядати як групу.