Знайдено документів: 1
Інформація × Реєстраційний номер 2125U002634, Матеріали видань та локальних репозитаріїв Категорія Бакалаврська робота Назва роботи Використання технологій автоматичного розпізнавання мовлення для генерації субтитрів для відео- та аудіоконтенту Автор Дата публікації 01-01-2025 Постачальник інформації Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» Першоджерело https://ela.kpi.ua/handle/123456789/75583 Видання Київ Опис Дипломна робота: 99 с., 20 рис., 7 табл., 29 посилань, 1 додаток. Об’єкт дослідження – відео- та аудіоконтент, що містить мовлення, та відповідні текстові транскрипції. Предмет дослідження – технології автоматичного розпізнавання мовлення, методи їх дотренування та інтеграція у системи генерації субтитрів. Мета роботи – розробка програмного забезпечення для автоматичної генерації субтитрів шляхом файн-тюнінгу ASR моделі та експериментального дослідження її ефективності. У ході дослідження реалізовано програмний продукт з веб-інтерфейсом, що забезпечує автоматичну генерацію субтитрів до відео- та аудіофайлів. Система використовує технології автоматичного розпізнавання мовлення, зокрема дотреновані на українських даних моделі Whisper, для перетворення мовлення у текст з часовими мітками. Проведено файн-тюнінг обраних моделей Whisper на українськомовному датасеті Common Voice 11.0 (uk). Здійснено експериментальне дослідження з оцінки якості розпізнавання дотренованих моделей за метриками WER та CER на тестовому наборі. На основі результатів визначено найбільш ефективну модель для даної задачі (Whisper Small), що продемонструвала найкращі показники на тестовому наборі. Розроблена система може бути використана для підвищення доступності відео- та аудіоконтенту шляхом його автоматичного субтитрування. Перспективи подальшого розвитку включають інтеграцію методів виявлення активності мовлення (VAD), розрізнення дикторів, вдосконалення редактора та розширення підтримки форматів. Додано в НРАТ 2025-09-29 Закрити
Матеріали
Бакалаврська робота
Використання технологій автоматичного розпізнавання мовлення для генерації субтитрів для відео- та аудіоконтенту : публікація 2025-01-01; Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2125U002634
Знайдено документів: 1

Оновлено: 2026-03-21