1 documents found
Information × Registration Number 2124U009579, Article popup.category Стаття, Опубліковано Title It 's called the Super-RESOLUTION . (AI translated) popup.author Козлов Сергій ЛеонідовичКолесницький Олег КостянтиновичKozlov Serhii LeonidovychKolesnytskyi Oleh Kostyantynovych popup.publication 28-02-2024 popup.source_user "Наукові праці Вінницького національного технічного університету" (Вінницький національний технічний університет) popup.source https://praci.vntu.edu.ua/index.php/praci/article/view/726 popup.publisher Вінницький національний технічний університет Description Протягом останніх 15-ти років згорткові нейронні мережі є основним підходом для вирішення задач комп'ютерного зору, і демонструють високий рівень продуктивності. Проте, архітектура трансформер, яка показала високі досягнення в галузі обробки природної мови, знаходить все ширше застосування до задач комп'ютерного зору і демонструє співставні або кращі результати. Нами розглянуто застосування архітектури трансформер до задачі super-resolution, а також наведено короткий огляд попередніх підходів. Безпосереднє застосування оригінальної архітектури трансформер дозволило забезпечити продуктивність, співставну з актуальними згортковими нейронними мережами. Проте, ефективне застосування архітектури трансформер до задач комп'ютерного зору пов'язане з викликами, які витікають з відмінностей між візуальним і мовленнєвим доменами. Перша відмінність - масштаб, оскільки зображення містять візуальні елементи різних масштабів, це ускладнює їх обробку за допомогою архітектури трансформер, що аналогічно до обробки токенів в ОПМ, працює з фрагментами одного розміру. Друга – об’єм інформації, адже обчислювальна складність обрахунку самоуваги квадратична довжині вхідної послідовності, що стає особливо критичним при обробці зображень високої роздільної здатності. У статті проведено аналіз 12 робіт з цієї тематики, опублікованих починаючи з 2021 року, які пропонують підходи до усунення зазначених складнощів. В проаналізованих роботах можуть бути виділені наступні напрямки: дослідження застосування локальної уваги з вікнами різних форм, зокрема вікнами розрідженої уваги; дослідження канальної самоуваги та її поєднання з просторовою; дослідження можливості розширення архітектури трансформер за допомогою згорткових блоків. Означені дослідження дозволили суттєво збільшити якість відтворених зображень, проте не є вичерпними. popup.nrat_date 2026-04-20 Close
Article
Стаття
Опубліковано
Козлов Сергій Леонідович. It 's called the Super-RESOLUTION . (AI translated)
:
published. 2024-02-28;
"Наукові праці Вінницького національного технічного університету" (Вінницький національний технічний університет), 2124U009579
1 documents found
search.subscribing
search.subscribe_text
Updated: 2026-04-27
