Знайдено документів: 1
Інформація × Реєстраційний номер 2123U002292, Матеріали видань та локальних репозитаріїв Категорія Бакалаврська робота Назва роботи Кластеризація текстових документів на основі методу k-найближчих сусідів Автор Мельник Антоній Михайлович Дата публікації 01-01-2023 Постачальник інформації Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» Першоджерело https://ela.kpi.ua/handle/123456789/61719 Видання Київ Опис Метою дипломної роботи є дослідження методу kнайближчих сусідів, а також створення на його основі алгоритму кластеризації текстових документів, також слід провести аналіз інших методів кластеризації, а також можливості адаптувати метод k-найближчих сусідів для кластеризації даних, оскільки зазвичай він використовується для класифікації даних, а не кластеризації. Впродовж дослідження даної теми, біло виявлено відсутність будь-яких напрацювань, щодо алгоритму кластеризації на основі методу k-найближчих сусідів. Тому вважаю дослідження в цій області, і розробку відповідного алгоритму цілком виправданими. Також окрім створення відповідного алгоритму, тема моєї дипломної роботи включає досить важливе уточнення, а саме кластеризацію саме текстових документів, що також під собою включає ряд інших запитань, а саме препроцесінг тексту, для кращої кластеризації наших вхідних даних. Не зважаючи на те що в області препроцесінгу тексту як для кластеризації так і класифікації текстових документів, вже є багато готових рішень, втім підбір правильної комбінації цих функцій є також досить важливим. В результаті виконання нашої дипломної роботи ми розробимо новий алгоритм для кластеризації, а також розробимо додаток, що буде реалізовувати кластеризації текстових документів на основі розробленого алгоритму. В кінці буде проведена оцінка працездатності цього алгоритму, на підібраному наборі текстових даних, яким буде також приділена увага. А також візуалізувавши наші тестові дані, ми оцінимо, чи коректно працює наш алгоритм. Створений додаток та алгоритм можна буде використовувати в подальших дослідженнях в області кластеризації даних, а також не зважаючи на відносну трудоємкість цього алгоритму, використовувати в певних задачах в області кластеризації текстових даних. Загальний обсяг роботи 99 с., 14 рис., 10 таблиць, 3 додатки, 17 джерела. Додано в НРАТ 2025-01-29 Закрити
Матеріали
Бакалаврська робота
Мельник Антоній Михайлович. Кластеризація текстових документів на основі методу k-найближчих сусідів : публікація 2023-01-01; Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2123U002292
Знайдено документів: 1

Оновлено: 2026-03-15