[:ua]Пошук академічних текстів[:en]Search academic texts[:]

Знайдено документів: 1

Інформація × Реєстраційний номер 2122U000996, Матеріали видань та локальних репозитаріїв Категорія Стаття, Опубліковано, Рецензована стаття Назва роботи ВИКОРИСТАННЯ ГЕНЕРАТИВНИХ ДИФУЗІЙНИХ МОДЕЛЕЙ МАШИННОГО НАВЧАННЯ У СТВОРЕННІ ЗОБРАЖЕНЬ Автор Rudenko O.Bilokin O.Rudenko O.Bilokin O. Дата публікації 29-11-2022 Постачальник інформації Національний університет «Полтавська політехніка імені Юрія Кондратюка» Першоджерело https://journals.nupp.edu.ua/sunz/article/view/2765 Видання Національний університет «Полтавська політехніка імені Юрія Кондратюка» Опис За останній рік стався значний сплеск популярності генеративних мереж. Завдяки публічним випускам таких просунутих моделей, як DALL-E, Stable Diffusions або GPT-3, кожен із скромним, звичайним апаратним забезпеченням може спробувати машинне навчання [3]. Моделі дифузії натхненні нерівноважною термодинамікою. Дифузійні моделі є підкатегорією моделей на основі ймовірності. Відомо, що вони пропонують надійно масштабовані високоточні зображення, зберігаючи при цьому нерухомий тренувальний об’єкт. Ці моделі генерують вибірки шляхом поступового видалення шуму із сигналу, а їх мета навчання може бути виражена як перезважена варіаційна нижня межа [2]. Цей клас моделей уже відповідає найсучаснішому [6] на CIFAR-10 [3], але все ще відстає від GAN щодо складних наборів даних, таких як LSUN і ImageNet. Нікол і Дхарівал [4] виявили, що ці моделі надійно вдосконалюються зі збільшенням обсягу обчислень і можуть створювати високоякісні зразки навіть на складному наборі даних ImageNet 256 × 256 за допомогою стека підвищення дискретизації. Проте FID цієї моделі все ще неконкурентоспроможний із BigGANdeep [5], поточним сучасним сучасним набором даних. Більше того, ці моделі здатні створювати нескінченну кількість унікальних високоякісних зображень, людської мови та реалістичної музики, яку на перший погляд неможливо відрізнити від рукотворної. Популярність генеративних моделей швидко зростає. Ймовірнісні моделі можуть забезпечити кращу продуктивність у порівнянні з GAN. Дифузійні моделі є новою перспективною категорією ймовірнісних моделей. DiscoDiffusion – це комбінація моделей CLIP та ImageNet. Вона може генерувати цифрові картини на основі текстових підказок. Для цієї моделі можливі численні застосування, такі як створення відео, анімації та графічного контенту. При виборі DiscoDiffusion замість GAN слід враховувати певні відмінності. Додано в НРАТ 2026-04-19 Закрити

Матеріали

Стаття

Опубліковано

Рецензована стаття

ВИКОРИСТАННЯ ГЕНЕРАТИВНИХ ДИФУЗІЙНИХ МОДЕЛЕЙ МАШИННОГО НАВЧАННЯ У СТВОРЕННІ ЗОБРАЖЕНЬ

Rudenko O.. ВИКОРИСТАННЯ ГЕНЕРАТИВНИХ ДИФУЗІЙНИХ МОДЕЛЕЙ МАШИННОГО НАВЧАННЯ У СТВОРЕННІ ЗОБРАЖЕНЬ : публікація 2022-11-29; Національний університет «Полтавська політехніка імені Юрія Кондратюка», 2122U000996

Знайдено документів: 1

Оновлено: 2026-04-20

Роздрукувати цю сторінку

Національний репозитарій академічних текстів

База даних НРАТ:

Звіти у сфері наукової і науково-технічної діяльності

Дисертації на здобуття наукових ступенів та автореферати

Матеріали видань та локальних репозитаріїв

Пошук академічних текстів