Знайдено документів: 1
Інформація × Реєстраційний номер 2125U002927, Матеріали видань та локальних репозитаріїв Категорія Бакалаврська робота Назва роботи Аналіз емоційного контексту зображень із використанням сучасних архітектур глибокого навчання Автор Яхненко Владислава ЮріївнаYakhnenko Vladyslava Yuriivna Дата публікації 01-01-2025 Постачальник інформації Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» Першоджерело https://ela.kpi.ua/handle/123456789/75892 Видання Київ Опис Дипломна робота: 85 с., 29 рис., 10 табл., 44 посилань, 1 додаток. Об’єктом дослідження є емоційний контекст зображень, що входять до складу анотованого датасету. Предметом дослідження є глибокі нейронні мережі, мультимодальні моделі, застосовані до задачі класифікації емоційного контексту в зображеннях. Метою роботи є порівняння підходів та визначення найоптимальнішого підходу до автоматичного визначення емоцій в зображеннях на основі візуальних, семантичних і мультимодальних ознак. В результаті виконання роботи реалізовано та протестовано три архітектурні рішення – EfficientNet-B0 (візуальний підхід), CLIP ViT-B/32 (семантичний підхід), та мультимодальну ансамблеву модель (CLIP_BLIP + CNN + DeiT). Найвищі показники продемонструвала мультимодальна ансамблева модель. Новизна полягає у практичному поєднанні візуальних, текстових і семантичних ознак для емоційної класифікації зображень без використання явних текстових підказок. Рекомендації щодо використання – цей підхід може знайти застосування в системах аналізу емоційного впливу рекламних матеріалів, зокрема для оптимізації візуального контенту відповідно до цільової емоційної реакції. Також можливе використання в суміжних сферах – UXдослідженнях, медіааналітиці. Thesis: 85 p., 29 figures, 10 tables, 44 references, appendix. The object of the study is the emotional context of visual content. The subject of the study is deep neural networks applied to the task of classifying the emotional context in images. The purpose of the work is to compare approaches and determine the most optimal solution for automatic recognition of emotions in images based on visual, semantic, and multimodal features. As a result of the work, three architectural solutions were implemented and tested – EfficientNet-B0 (visual approach), CLIP ViT-B/32 (semantic approach), and a multimodal ensemble model (CLIP_BLIP + CNN + DeiT). The highest performance was demonstrated by the multimodal ensemble model. The novelty lies in the practical combination of visual, textual, and semantic features for emotion classification in images without the use of explicit textual prompts. Recommendations for use – this approach can be applied in systems for analyzing the emotional impact of advertising materials, particularly for optimizing visual content according to the target emotional response. It can also be used in related fields – UX research, media analytics. Додано в НРАТ 2025-11-05 Закрити
Матеріали
Бакалаврська робота
Яхненко Владислава Юріївна. Аналіз емоційного контексту зображень із використанням сучасних архітектур глибокого навчання
:
публікація 2025-01-01;
Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2125U002927
Знайдено документів: 1
Підписка
Повний текст наразі ще відсутній.
Повідомити вам про надходження повного тексту?
Повідомити вам про надходження повного тексту?
Оновлено: 2026-03-18
