Знайдено документів: 1
Інформація × Реєстраційний номер 0421U101633, Кандидатська дисертація На здобуття Кандидат технічних наук Дата захисту 26-04-2021 Статус Запланована Назва роботи Інформаційна технологія аналізу й визначення авторської та стильової належності українськомовних текстів Здобувач Лупей Максим Іванович, Керівник Міца Олександр Володимирович Опонент Сеньківський Всеволод Миколаєвич Опонент Машталір Сергій Володимирович Рецензент Тимченко Олександр Володимирович Рецензент Огірко Ігор Васильович Опис У дисертаційній роботі запропоновано вирішення науково-прикладної задачі створення інформаційної технології для аналізу й визначення авторської та стильової належності українськомовних текстів. Для цього було проведено кілько етапів роботи із даними. Проведено аналіз особливостей українськомовних текстів різних стилів та розглянуто особливості української граматики стосовно формування кінцівок слів, що необхідно для проведення етапу попереднього опрацювання українськомовних текстів. В роботі використовується метод стемінгу, який спеціальним чином адаптований під українську мову. На наступному етапі проаналізовано існуючі методи векторизації українськомовного тексту, серед яких виділено метод, що базується на хеш-функціях, метод векторизації за основі зворотної частоти документів та метод векторизації, що базується на частоті документів. Проведено класифікацію різних методів векторизації українськомовного тексту в поєднанні з різними типами машинного навчання та виявлено найкраще їх співвідношення для кожного типу досліджуваних завдань. Здійснено вибір методів машинного навчання для аналізу й визначення авторської та стильової належності українськомовних текстів, до яких можна віднести різні комбінації архітектур штучних нейронних мереж (MLP, SVR та SVC штучні нейронні мережі). На базі проведеної класифікації методів та підходів векторизації та класифікації, розроблено інформаційну технологію для аналізу й визначення авторської та стильової належності українськомовних текстів. В результаті визначено переваги методів машинного навчання та їхнє використання для створення інформаційних технологій. Проведено вибір методів векторизації текстів, їхню апробацію в рамках інформаційної технології для аналізу українськомовних текстів в комбінації із різними типами машинного навчання, під час якої визначено, що найкращі результати отримано саме при використанні векторизації з використанням зворотної частоти документу та методу векторизації, що базується на використанні хеш-функцій. Було удосконалено метод класифікації текстової інформації на базі багатошарового персептрону за рахунок використання спеціалізованих процедур навчання та регуляризаційних процедур, що надає можливість зменшити час прийняття рішення без втрати точності. Дата реєстрації 2021-05-14 Додано в НРАТ 2021-05-14 Закрити
Дисертація кандидатська
2
Лупей Максим Іванович. Інформаційна технологія аналізу й визначення авторської та стильової належності українськомовних текстів : Кандидат технічних наук : спец.. 05.13.06 - Інформаційні технології : дата захисту 2021-04-26; Статус: Захищена; Державний вищий навчальний заклад "Ужгородський національний унiверситет". – Ужгород, 0421U101633.
Знайдено документів: 1

Оновлено: 2026-03-19