Знайдено документів: 1
Інформація × Реєстраційний номер 2121U003625, Матеріали видань та локальних репозитаріїв Категорія Master thesis Назва роботи Порівняльний аналіз якості методів кластеризації: задача кластеризації італійських вин Автор Дата публікації 01-01-2021 Постачальник інформації Сумський державний університет Першоджерело https://essuir.sumdu.edu.ua/handle/123456789/86511 Видання Сумський державний університет Опис У роботі проведено порівняльний аналіз якості методів кластеризації на прикладі задачі про кластеризацію італійських вин за їх хімічним складом, за даними https://www.kaggle.com/harrywang/wine-dataset-for-clustering. Використовуючи стандартні методи визначено кількість кластерів в досліджуваному наборі даних, що дорівнює трьом. Для підвищення якості кластеризації було запропоновано провести попередню обробку даних, щоб середні значення усіх характеристик досліджуваних об’єктів дорівнювали нулю, а дисперсія – одиниці. Така попередня обробка даних дозволила підвищити точність (accuracy) розпізнавання кластерів з 71% до 97%. З’ясовано, що таке суттєве підвищення якості кластеризації пов’язано зі зміною масштабів ознак, що суттєво вплинуло на відстань між об’єктами. Запропоновано використовувати зміну масштабу ознак для підвищення якості кластеризації. Отримано, що найвища якість кластеризації на досліджуваних даних досягається за допомогою метода K means (accuracy дорівнює 96,6%). Додано в НРАТ 2025-05-12 Закрити
Матеріали
Master thesis
Порівняльний аналіз якості методів кластеризації: задача кластеризації італійських вин : публікація 2021-01-01; Сумський державний університет, 2121U003625
Знайдено документів: 1

Оновлено: 2026-03-17