Завдання для самостійного опрацювання
Контрольні запитання для самоперевірки
- Для розв’язання яких задач застосовують методи кластерного аналізу?
- Дайте визначення поняття «кластер».
- Назвіть основні властивості кластера.
- Які ви знаєте типи кластерних структур?
- Назвіть основні етапи кластерного аналізу.
- З якою метою здійснюється нормування початкових даних у кластерному аналізі?
- Які міри подібності використовують у кластерному аналізі?
- Назвіть міри відстані, які використовують найчастіше.
- У чому полягає відмінність між евклідовою відстанню та зваженою евклідовою відстанню?
- При виконанні яких умов міра подібності є метрикою?
Тестові завдання
Практичні завдання
Завдання 1
У табл. 3.5 наведено вісім об’єктів, які характеризуються двома показниками \(x_1\) і \(x_2\). Необхідно розрахувати евклідові відстані між першим та другим, третім та четвертим, п’ятим та восьмим об’єктами.
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |
---|---|---|---|---|---|---|---|---|
\(x_1\) | 119,4 | 121,0 | 16,6 | 114,2 | 115,8 | 15,2 | 17,9 | 117,5 |
\(x_2\) | 16,6 | 18,1 | 15,5 | 19,4 | 23,2 | 16,7 | 15,7 | 15,2 |
Завдання 2
У табл. 3.6 наведено вісім об’єктів, які характеризуються двома показниками \(x_1\) і \(x_2\). Необхідно розрахувати евклідові відстані між першим та сьомим, четвертим та шостим, сьомим та восьмим об’єктами.
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |
---|---|---|---|---|---|---|---|---|
\(x_1\) | 73,2 | 60,2 | 63,7 | 70,6 | 95,1 | 75,8 | 93,4 | 50,5 |
\(x_2\) | 12,2 | 11,6 | 1,6 | 13,7 | 16,1 | 11,1 | 16,5 | 1,2 |
Завдання 3
У табл. 3.7 наведено вісім об’єктів, які характеризуються двома показниками \(x_1\) і \(x_2\). Необхідно розрахувати зважені евклідові відстані між другим та п’ятим, шостим та сьомим, третім та восьмим об’єктами, \(w_1 = 0,3; w_2 = 0,7\).
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |
---|---|---|---|---|---|---|---|---|
\(x_1\) | 114,4 | 116,0 | 11,6 | 19,2 | 110,8 | 11,2 | 12,9 | 112,5 |
\(x_2\) | 12,6 | 14,1 | 12,5 | 15,4 | 19,2 | 11,7 | 12,7 | 12,2 |
Завдання 4
У табл. 3.8 наведено вісім об’єктів, які характеризуються двома показниками \(x_1\) і \(x_2\). Необхідно розрахувати матрицю відстаней city-block (мангетенських) між третім та четвертим, третім та шостим, четвертим та сьомим об’єктами.
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |
---|---|---|---|---|---|---|---|---|
\(x_1\) | 133,2 | 120,2 | 133,7 | 120,6 | 115,1 | 145,8 | 153,4 | 137,5 |
\(x_2\) | 24,2 | 20,6 | 16,6 | 36,7 | 35,1 | 72,1 | 56,5 | 54,2 |
Завдання 5
У табл. 3.9 наведено п’ять об’єктів, які характеризуються трьома показниками \(x_1, x_2, x_3\).
Номер об’єкта | \(x_1\) | \(x_2\) | \(x_3\) |
---|---|---|---|
1 | 1 | 1 | 0 |
2 | 1 | 1 | 1 |
3 | 0 | 0 | 1 |
4 | 0 | 1 | 0 |
5 | 1 | 1 | 1 |
Розрахуйте коефіцієнти Жаккара між першим та другим, першим та четвертим, третім та п’ятим об’єктами.