Знайдено документів: 1
Інформація × Реєстраційний номер 2124U009579, Матеріали видань та локальних репозитаріїв Категорія Стаття, Опубліковано Назва роботи ЗАСТОСУВАННЯ АРХІТЕКТУРИ ТРАНСФОРМЕР ДО ЗАДАЧІ SUPER-RESOLUTION Автор Козлов Сергій ЛеонідовичКолесницький Олег КостянтиновичKozlov Serhii LeonidovychKolesnytskyi Oleh Kostyantynovych Дата публікації 28-02-2024 Постачальник інформації "Наукові праці Вінницького національного технічного університету" (Вінницький національний технічний університет) Першоджерело https://praci.vntu.edu.ua/index.php/praci/article/view/726 Видання Вінницький національний технічний університет Опис Протягом останніх 15-ти років згорткові нейронні мережі є основним підходом для вирішення задач комп'ютерного зору, і демонструють високий рівень продуктивності. Проте, архітектура трансформер, яка показала високі досягнення в галузі обробки природної мови, знаходить все ширше застосування до задач комп'ютерного зору і демонструє співставні або кращі результати. Нами розглянуто застосування архітектури трансформер до задачі super-resolution, а також наведено короткий огляд попередніх підходів. Безпосереднє застосування оригінальної архітектури трансформер дозволило забезпечити продуктивність, співставну з актуальними згортковими нейронними мережами. Проте, ефективне застосування архітектури трансформер до задач комп'ютерного зору пов'язане з викликами, які витікають з відмінностей між візуальним і мовленнєвим доменами. Перша відмінність - масштаб, оскільки зображення містять візуальні елементи різних масштабів, це ускладнює їх обробку за допомогою архітектури трансформер, що аналогічно до обробки токенів в ОПМ, працює з фрагментами одного розміру. Друга – об’єм інформації, адже обчислювальна складність обрахунку самоуваги квадратична довжині вхідної послідовності, що стає особливо критичним при обробці зображень високої роздільної здатності. У статті проведено аналіз 12 робіт з цієї тематики, опублікованих починаючи з 2021 року, які пропонують підходи до усунення зазначених складнощів. В проаналізованих роботах можуть бути виділені наступні напрямки: дослідження застосування локальної уваги з вікнами різних форм, зокрема вікнами розрідженої уваги; дослідження канальної самоуваги та її поєднання з просторовою; дослідження можливості розширення архітектури трансформер за допомогою згорткових блоків. Означені дослідження дозволили суттєво збільшити якість відтворених зображень, проте не є вичерпними. Додано в НРАТ 2026-04-20 Закрити
Матеріали
Стаття
Опубліковано
Козлов Сергій Леонідович. ЗАСТОСУВАННЯ АРХІТЕКТУРИ ТРАНСФОРМЕР ДО ЗАДАЧІ SUPER-RESOLUTION : публікація 2024-02-28; "Наукові праці Вінницького національного технічного університету" (Вінницький національний технічний університет), 2124U009579
Знайдено документів: 1

Оновлено: 2026-04-27