1 documents found
Information × Registration Number 2125U002896, Article popup.category Бакалаврська робота Title Технології конвертації голосових даних у текстовий формат (AI translated) popup.author Антонов Данііл ДмитровичAntonov Daniil Dmytrovych popup.publication 01-01-2025 popup.source_user Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» popup.source https://ela.kpi.ua/handle/123456789/75893 popup.publisher Київ Description Дипломна робота: 84 с., 10 рис., 9 табл., 14 посилань. У дипломній роботі досліджено методи й архітектури систем автоматичного розпізнавання мовлення (ASR), які дозволяють здійснювати точне перетворення аудіоінформації у текстовий формат. Проведено порівняльний аналіз класичних (HMM, GMM) і сучасних (RNN, Transformer, CTC) підходів. Описано принципи екстракції ознак (MFCC, лог-мел-спектрограми), оцінено вплив шумів і мовних варіацій на точність розпізнавання. Реалізовано прототип системи на базі моделей Whisper та Wav2Vec2, проведено тестування на реальних аудіоданих з використанням метрик WER та CER. Зроблено функціонально-вартісний аналіз і обґрунтовано вибір оптимального рішення для практичної інтеграції. The work consist of 10 images, 9 tables, 14 sources. The thesis explores methods and architectures for automatic speech recognition (ASR) systems that allow accurate conversion of audio data into text format. A comparative analysis of classical (HMM, GMM) and modern (RNN, Transformer, CTC) approaches is conducted. Feature extraction methods (MFCC, log-mel spectrograms) are described, and the impact of noise and speech variability on recognition accuracy is assessed. A prototype system based on Whisper and Wav2Vec2 models is implemented and tested on real audio data using WER and CER metrics. A functional-cost analysis is performed, and the choice of the optimal solution for practical integration is justified. popup.nrat_date 2025-11-05 Close
Article
Бакалаврська робота
Антонов Данііл Дмитрович. Технології конвертації голосових даних у текстовий формат (AI translated) : published. 2025-01-01; Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2125U002896
1 documents found

Updated: 2026-03-24