Завдання для самостійного опрацювання

Контрольні запитання для самоперевірки

  1. Назвіть основні групи методів кластерного аналізу.
  2. У чому полягає відмінність агломеративних і дивізимних методів?
  3. Назвіть основні етапи методу куль.
  4. Охарактеризуйте метод дендритів.
  5. Наведіть критерії оцінювання якості класифікації.
  6. У чому полягає особливість ієрархічних кластер-процедур?
  7. Наведіть алгоритм методу \(k\)-середніх.
  8. Назвіть етапи алгоритму побудови дендрита.
  9. Назвіть особливості нечітких методів класифікації.
  10. Визначіть особливості застосування критеріїв якості класифікації.

Тестові завдання

Практичні завдання

Завдання 1

У таблиці 4.6 наведені вісім країн, які характеризуються двома показниками туристичної привабливості: \(x_1\) — площа, яку займають туристичні ресурси, км2; \(x_2\) — інвестиції в основний капітал готелів і ресторанів, млн дол. Необхідно провести кластеризацію країн, описаних двома показниками, за методом «найближчого сусіда». В обчисленні відстаней використовуйте просту евклідову відстань.

Розрахуйте відстані за методом «найближчого сусіда» між другим об’єктом та новим утвореним кластером, між четвертим об’єктом та новим утвореним кластером,між шостим об’єктом та новим утвореним кластером.

Табл. 4.6: Вихідні дані
№ об’єкта 1 2 3 4 5 6 7 8
\(x_{1}\) 119,4 121,0 16,6 114,2 115,8 15,2 17,9 117,5
\(x_{2}\) 16,6 18,1 15,5 19,4 23,2 16,7 15,7 15,2
Завдання 2

У таблиці 4.7 наведені вісім підприємств, які характеризуються двома показниками фінансового стану: \(x_1\) — виручка від реалізації, млн грн; \(x_2\) — рентабельність підприємства, %. Необхідно провести кластеризацію підприємств, описаних двома показниками, за методом «далекого сусіда». В обчисленні відстаней використовуйте відстань city-block. В обчисленні відстаней використовуйте відстань city-block.

Розрахуйте відстані за методом «далекого сусіда» між першим об’єктом та новим утвореним кластером, між другим об’єктом та новим утвореним кластером, між восьмим об’єктом та новим утвореним кластером.

Табл. 4.7: Вихідні дані
№ об’єкта 1 2 3 4 5 6 7 8
\(x_{1}\) 121,4 123,0 18,6 116,2 117,8 17,2 19,9 119,5
\(x_{2}\) 18,6 10,1 17,5 11,4 15,2 18,7 17,7 17,2
Завдання 3

У таблиці 4.8 наведені вісім регіонів країни, які характеризуються двома показниками туристичної привабливості: \(x_1\) — площа, яку займають туристичні ресурси, км2; \(x_2\) — інвестиції в основний капітал готелів і ресторанів, млн дол. Необхідно провести кластеризацію країн, описаних двома показниками, за методом середнього зв’язку. В обчисленні відстаней використовуйте просту зважену евклідову відстань \(w_1 = 0.4, w_2 = 0.6\).

Розрахуйте відстані за методом середнього зв’язку між першим об’єктом та новим утвореним кластером, між другим об’єктом та новим утвореним кластером, між сьомим об’єктом та новим утвореним кластером.

Табл. 4.8: Вихідні дані
№ об’єкта 1 2 3 4 5 6 7 8
\(x_{1}\) 114,4 116,0 11,6 19,2 110,8 11,2 12,9 112,5
\(x_{2}\) 12,6 14,1 12,5 15,4 19,2 11,7 12,7 12,2
Завдання 4

У таблиці 4.9 наведені шість підприємств, які характеризуються двома показниками фінансового стану: \(x_1\) — виручка від реалізації, млн грн, \(x_2\) — рентабельність підприємства, %. Необхідно провести кластеризацію підприємств, описаних двома показниками, за методом дендритів, знайти елементи з \(min\) відстанню між собою у першому, другому, шостому рядках матриці евклідових відстаней.

Табл. 4.9: Вихідні дані
№ об’єкта 1 2 3 4 5 6 7 8
\(x_{1}\) 113,2 110,2 113,7 110,6 19,1 125,8 144,2 114,8
\(x_{2}\) 24,2 29,6 26,6 26,7 20,1 12,1 25,7 30,5
Завдання 5

У таблиці 4.10 наведені сім країн, які характеризуються двома показниками інвестиційної привабливості: \(x_1\) — обсяг ринку збуту продукції, млрд дол., \(x_2\) — рентабельність виробництва, %. Необхідно провести кластеризацію підприємств, описаних двома показниками, за методом куль, обчислити радіус кулі.

Табл. 4.10: Вихідні дані
№ об’єкта 1 2 3 4 5 6 7 8
\(x_{1}\) 133,2 120,2 133,7 120,6 115,1 145,8 137,5 138,6
\(x_{2}\) 24,2 20,6 16,6 36,7 35,1 30,1 19,2 27,4