1 documents found
Information × Registration Number 0826U000469, PhD dissertation Status Доктор філософії Date popup.evolution o Title Information Technology for Automation of Short Product Descriptions Hierarchical Classification in E-Commerce Author Olga O. Narushynska, popup.head Vasyl M. Teslyuk popup.opponent Oleg V. Bisikalo popup.opponent Oksana Y. Mulesa popup.review Iryna V. Pikh popup.review Vasyl V. Lytvyn Description У дисертації розглянуто підвищення ефективності процесів ієрархічної класифікації коротких текстів у сфері електронної комерції шляхом інтеграції ручного маркування даних, методів машинного навчання та сучасних підходів до побудови багаторівневих класифікаційних моделей і стандартизації інформаційних потоків. У вступі обґрунтовано актуальність теми дисертаційної роботи, сформульовано мету та основні завдання досліджень, визначено наукову новизну роботи і практичне значення отриманих результатів, показано зв'язок роботи з науковими темами. Подано відомості про апробацію результатів роботи та особистий внесок автора та його публікації. У першому розділі дисертаційного дослідження здійснено ґрунтовний аналіз сучасних підходів до ієрархічної класифікації коротких текстів, зокрема в контексті електронної комерції, де класифікація товарів потребує особливої точності та узгодженості. Детально розглянуто наукові досягнення у сфері розроблення стандартів, що забезпечують уніфікацію інформаційних потоків, таких як Global Product Classification (GPC). Увагу приділено класифікаційним моделям, що враховують багаторівневу структуру даних, зокрема глобальним, локальним і плоским моделям, а також їхнім перевагам і недолікам. Особливий акцент зроблено на специфіці коротких текстів, які є обмеженими в контексті, часто містять скорочення, числові позначення та унікальні терміни. Аналіз показав, що традиційні моделі, хоча й демонструють певні успіхи, потребують адаптації до умов складних ієрархій і високого рівня дисбалансу даних. На основі аналізу сформульовано ключові вимоги до сучасних моделей ієрархічної класифікації: точність результатів навіть у випадку рідкісних категорій, ефективність роботи з великими обсягами даних, масштабованість і здатність до автоматизованого розширення функціоналу. У другому розділі вдосконалено процес синтезу навчальних наборів даних для задач ієрархічної класифікації коротких текстів. Побудовано метод оптимізації процесу ручного маркування даних, який грунтується на впорядкуванні текстів за допомогою методу упорядкування листків у ієрархічній кластеризації. Цей метод дає змогу розташовувати схожі описи товарів поруч, що значно знижує когнітивне навантаження на анотаторів і підвищує ефективність процесу маркування. Підхід інтегровано в інструменти для маркування даних, такі як Label Studio, де налаштування відповідали стандарту GPC і забезпечували точність анотацій на всіх рівнях ієрархії. Впровадження сортування даних забезпечило скорочення часу маркування та забезпечити узгодженість між експертами. Крім того, вдосконалено метод опрацювання коротких текстів, який базується на інтеграції методу кодування пар байтів (Byte Pair Encoding, BPE) із контекстуальними вкладеннями слів (англ. word embedding) BERT. Поєднання цього методу з BERT моделлю забезпечило синтез контекстуальних репрезентативних векторних представлень тексту, які враховують як локальні семантичні зв’язки між підсловами, так і глобальний контекст. Така інтеграція дала змогу підвищити точність класифікації, особливо на нижніх рівнях ієрархії, де деталізація даних є найбільш критичною. Розроблений метод опрацювання коротких текстів також сприяв зменшенню розмірності ознакового простору, що знижує обчислювальні витрати та мінімізує ризик перенавчання моделі. Такий метод є універсальним і може бути інтегрований у широкий спектр задач, пов’язаних із ієрархічною класифікацією текстів. У третьому розділі розроблено модель ієрархічної класифікації текстів, засновану на показнику штрафного інформаційного приросту (Penalized Information Gain, PIG) та його динамічній модифікації, що дає змогу адаптивно враховувати ієрархічні зв’язки між класами, мінімізувати каскадні помилки та забезпечувати вищу точність передбачення. Проведені експерименти продемонстрували ефективність моделей у задачах класифікації, що підтверджується підвищенням точності на різних рівнях ієрархії. Додатково, інтеграція цих моделей у бізнес-процеси електронної комерції показала практичну цінність у реальних умовах, де точність класифікації безпосередньо впливає на ефективність логістичних і комерційних процесів. У четвертому розділі розроблено розподілену інформаційну технологію для автоматизації ієрархічної класифікації коротких текстів. Розроблена структура грунтується на модульному підході, що забезпечує масштабованість і гнучкість системи. У технології використано сучасні методи інтеграції даних і стандарти GPC, що уможливлює ефективну роботу з багатомовними й багатокультурними ринками. Особливу увагу приділено забезпеченню сумісності та відкритості програмно- 5 апаратного забезпечення, що забезпечує умови для широкого використання технології. Registration Date 2026-03-05 popup.nrat_date 2026-03-05 Close
PhD dissertation
Olga O. Narushynska. Information Technology for Automation of Short Product Descriptions Hierarchical Classification in E-Commerce : Доктор філософії : spec.. 122 - Комп’ютерні науки : presented. ; popup.evolution: o; Lviv Polytechnic National University. – Львів, 0826U000469.
1 documents found

Updated: 2026-03-23