Знайдено документів: 1
Інформація × Реєстраційний номер 0826U000469, Дисертація доктора філософії На здобуття Доктор філософії Дата захисту Статус Запланована Назва роботи Інформаційна технологія інтелектуальної ієрархічної класифікації коротких описів товарів у сфері електронної комерції Здобувач Нарушинська Ольга Олександрівна, Керівник Теслюк Василь Миколайович Опонент Бісікало Олег Володимирович Опонент Мулеса Оксана Юріївна Рецензент Піх Ірина Всеволодівна Рецензент Литвин Василь Володимирович Опис У дисертації розглянуто підвищення ефективності процесів ієрархічної класифікації коротких текстів у сфері електронної комерції шляхом інтеграції ручного маркування даних, методів машинного навчання та сучасних підходів до побудови багаторівневих класифікаційних моделей і стандартизації інформаційних потоків. У вступі обґрунтовано актуальність теми дисертаційної роботи, сформульовано мету та основні завдання досліджень, визначено наукову новизну роботи і практичне значення отриманих результатів, показано зв'язок роботи з науковими темами. Подано відомості про апробацію результатів роботи та особистий внесок автора та його публікації. У першому розділі дисертаційного дослідження здійснено ґрунтовний аналіз сучасних підходів до ієрархічної класифікації коротких текстів, зокрема в контексті електронної комерції, де класифікація товарів потребує особливої точності та узгодженості. Детально розглянуто наукові досягнення у сфері розроблення стандартів, що забезпечують уніфікацію інформаційних потоків, таких як Global Product Classification (GPC). Увагу приділено класифікаційним моделям, що враховують багаторівневу структуру даних, зокрема глобальним, локальним і плоским моделям, а також їхнім перевагам і недолікам. Особливий акцент зроблено на специфіці коротких текстів, які є обмеженими в контексті, часто містять скорочення, числові позначення та унікальні терміни. Аналіз показав, що традиційні моделі, хоча й демонструють певні успіхи, потребують адаптації до умов складних ієрархій і високого рівня дисбалансу даних. На основі аналізу сформульовано ключові вимоги до сучасних моделей ієрархічної класифікації: точність результатів навіть у випадку рідкісних категорій, ефективність роботи з великими обсягами даних, масштабованість і здатність до автоматизованого розширення функціоналу. У другому розділі вдосконалено процес синтезу навчальних наборів даних для задач ієрархічної класифікації коротких текстів. Побудовано метод оптимізації процесу ручного маркування даних, який грунтується на впорядкуванні текстів за допомогою методу упорядкування листків у ієрархічній кластеризації. Цей метод дає змогу розташовувати схожі описи товарів поруч, що значно знижує когнітивне навантаження на анотаторів і підвищує ефективність процесу маркування. Підхід інтегровано в інструменти для маркування даних, такі як Label Studio, де налаштування відповідали стандарту GPC і забезпечували точність анотацій на всіх рівнях ієрархії. Впровадження сортування даних забезпечило скорочення часу маркування та забезпечити узгодженість між експертами. Крім того, вдосконалено метод опрацювання коротких текстів, який базується на інтеграції методу кодування пар байтів (Byte Pair Encoding, BPE) із контекстуальними вкладеннями слів (англ. word embedding) BERT. Поєднання цього методу з BERT моделлю забезпечило синтез контекстуальних репрезентативних векторних представлень тексту, які враховують як локальні семантичні зв’язки між підсловами, так і глобальний контекст. Така інтеграція дала змогу підвищити точність класифікації, особливо на нижніх рівнях ієрархії, де деталізація даних є найбільш критичною. Розроблений метод опрацювання коротких текстів також сприяв зменшенню розмірності ознакового простору, що знижує обчислювальні витрати та мінімізує ризик перенавчання моделі. Такий метод є універсальним і може бути інтегрований у широкий спектр задач, пов’язаних із ієрархічною класифікацією текстів. У третьому розділі розроблено модель ієрархічної класифікації текстів, засновану на показнику штрафного інформаційного приросту (Penalized Information Gain, PIG) та його динамічній модифікації, що дає змогу адаптивно враховувати ієрархічні зв’язки між класами, мінімізувати каскадні помилки та забезпечувати вищу точність передбачення. Проведені експерименти продемонстрували ефективність моделей у задачах класифікації, що підтверджується підвищенням точності на різних рівнях ієрархії. Додатково, інтеграція цих моделей у бізнес-процеси електронної комерції показала практичну цінність у реальних умовах, де точність класифікації безпосередньо впливає на ефективність логістичних і комерційних процесів. У четвертому розділі розроблено розподілену інформаційну технологію для автоматизації ієрархічної класифікації коротких текстів. Розроблена структура грунтується на модульному підході, що забезпечує масштабованість і гнучкість системи. У технології використано сучасні методи інтеграції даних і стандарти GPC, що уможливлює ефективну роботу з багатомовними й багатокультурними ринками. Особливу увагу приділено забезпеченню сумісності та відкритості програмно- 5 апаратного забезпечення, що забезпечує умови для широкого використання технології. Дата реєстрації 2026-03-05 Додано в НРАТ 2026-03-05 Закрити
Дисертація доктор філос.
Нарушинська Ольга Олександрівна. Інформаційна технологія інтелектуальної ієрархічної класифікації коротких описів товарів у сфері електронної комерції
: Доктор філософії :
спец.. 122 - Комп’ютерні науки :
дата захисту ; Статус: Запланована;
Національний університет "Львівська політехніка". – Львів, 0826U000469.
Знайдено документів: 1
Підписка
Повний текст наразі ще відсутній.
Повідомити вам про надходження повного тексту?
Повідомити вам про надходження повного тексту?
Оновлено: 2026-03-16
