Знайдено документів: 1
Інформація × Реєстраційний номер 2125U002896, Матеріали видань та локальних репозитаріїв Категорія Бакалаврська робота Назва роботи Технології конвертації голосових даних у текстовий формат Автор Антонов Данііл ДмитровичAntonov Daniil Dmytrovych Дата публікації 01-01-2025 Постачальник інформації Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» Першоджерело https://ela.kpi.ua/handle/123456789/75893 Видання Київ Опис Дипломна робота: 84 с., 10 рис., 9 табл., 14 посилань. У дипломній роботі досліджено методи й архітектури систем автоматичного розпізнавання мовлення (ASR), які дозволяють здійснювати точне перетворення аудіоінформації у текстовий формат. Проведено порівняльний аналіз класичних (HMM, GMM) і сучасних (RNN, Transformer, CTC) підходів. Описано принципи екстракції ознак (MFCC, лог-мел-спектрограми), оцінено вплив шумів і мовних варіацій на точність розпізнавання. Реалізовано прототип системи на базі моделей Whisper та Wav2Vec2, проведено тестування на реальних аудіоданих з використанням метрик WER та CER. Зроблено функціонально-вартісний аналіз і обґрунтовано вибір оптимального рішення для практичної інтеграції. The work consist of 10 images, 9 tables, 14 sources. The thesis explores methods and architectures for automatic speech recognition (ASR) systems that allow accurate conversion of audio data into text format. A comparative analysis of classical (HMM, GMM) and modern (RNN, Transformer, CTC) approaches is conducted. Feature extraction methods (MFCC, log-mel spectrograms) are described, and the impact of noise and speech variability on recognition accuracy is assessed. A prototype system based on Whisper and Wav2Vec2 models is implemented and tested on real audio data using WER and CER metrics. A functional-cost analysis is performed, and the choice of the optimal solution for practical integration is justified. Додано в НРАТ 2025-11-05 Закрити
Матеріали
Бакалаврська робота
Антонов Данііл Дмитрович. Технології конвертації голосових даних у текстовий формат : публікація 2025-01-01; Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2125U002896
Знайдено документів: 1

Оновлено: 2026-03-17