7.4 Оцінювання якості діагностичного простору ознак

Слід зазначити, що розглянуті в розділах 6 і 7 способи побудови системи діагностичних показників мають певні недоліки. Щодо застосування методу «центра ваги» в принципі немає впевненості щодо правильності вибору саме цієї, а не іншої ознаки, оскільки значення показників, серед яких вибираються істотні ознаки, не завжди достатньо відрізняються. Таким чином, роль істотної ознаки однаково добре можуть виконувати кілька ознак. Метод таксономічного показника рівня розвитку вільний від згаданого недоліку. Однак вадою цього методу є суб’єктивна розбивка ознак на стимулятори та дестимулятори. Тому для вибору найбільш доцільного методу скорочення інформаційного простору показників проводиться аналіз одного із критеріїв якості діагностичного простору — відсотка поясненої дисперсії. За допомогою цього критерію визначається, яку частину всього обсягу інформації, що втримується в усіх вихідних показниках, вдалося пояснити введеними діагностичними показниками. У табл. 7.9 подані формули розрахунку даного критерію для різних методів скорочення простору ознак.

Табл. 7.9

Способи розрахунків відсотка поясненої дисперсії для різних методів скорочення інформаційного простору ознак

Методи Формула розрахунку відсотка поясненої дисперсії Умовні позначення
Таксономічний показник рівня розвитку \(e = \frac{1}{N} \sum_{n=1}^N r^{2_n}\) \(r_n\) — коефіцієнт кореляції \(n\)-го вихідного показника з таксономічним показником \((n = 1, N)\)
Метод «центра ваги» \(e_k = \frac{1}{p_k} \sum_{l=1}^{p_k} r^{2_{lk}}\)
\(k = 1, 2, ..., K\)
\(e = \frac{1}{K} \sum_{k=1}^K e_k\)
\(k\) — номер групи показників; \(p_k\) — число показників у підмножині \(k\); \(r_{lk}\) — коефіцієнт кореляції між діагностичним показником групи \(k\) і \(l\)-м показником, що входить до складу групи \(k\) показників

Серед альтернативних систем діагностичних ознак, які отримані за допомогою різних методів редукції ознак, обирається система, для якої відсоток поясненої дисперсії є найбільшим.