1 documents found
Information × Registration Number 2121U003625, Article popup.category Master thesis Title popup.author popup.publication 01-01-2021 popup.source_user Сумський державний університет popup.source https://essuir.sumdu.edu.ua/handle/123456789/86511 popup.publisher Сумський державний університет Description У роботі проведено порівняльний аналіз якості методів кластеризації на прикладі задачі про кластеризацію італійських вин за їх хімічним складом, за даними https://www.kaggle.com/harrywang/wine-dataset-for-clustering. Використовуючи стандартні методи визначено кількість кластерів в досліджуваному наборі даних, що дорівнює трьом. Для підвищення якості кластеризації було запропоновано провести попередню обробку даних, щоб середні значення усіх характеристик досліджуваних об’єктів дорівнювали нулю, а дисперсія – одиниці. Така попередня обробка даних дозволила підвищити точність (accuracy) розпізнавання кластерів з 71% до 97%. З’ясовано, що таке суттєве підвищення якості кластеризації пов’язано зі зміною масштабів ознак, що суттєво вплинуло на відстань між об’єктами. Запропоновано використовувати зміну масштабу ознак для підвищення якості кластеризації. Отримано, що найвища якість кластеризації на досліджуваних даних досягається за допомогою метода K means (accuracy дорівнює 96,6%). popup.nrat_date 2025-05-12 Close
Article
Master thesis
:
published. 2021-01-01;
Сумський державний університет, 2121U003625
1 documents found
search.subscribing
search.subscribe_text
Updated: 2026-03-25
