Знайдено документів: 1
Інформація × Реєстраційний номер 0825U002000, Дисертація доктора філософії На здобуття Доктор філософії Дата захисту 15-07-2025 Статус Наказ про видачу диплома Назва роботи Адаптивні системи оброблення акустичної інформації для створення персоналізованого медіаконтенту Здобувач Борисов Гліб Олександрович, Керівник Трапезон Кирило Олександрович Опонент Можаєв Олександр Олександрович Опонент Сокол Галина Іванівна Рецензент Дрозденко Олександр Іванович Рецензент Гребінь Олександр Павлович Опис Борисов Г.О. Адаптивні системи оброблення акустичної інформації для створення персоналізованого медіаконтенту. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії у галузі знань 17 – Електроніка та телекомунікації за спеціальністю 171 «Електроніка». – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», МОН України, Київ, 2025. Дисертаційна робота присвячена дослідженню адаптивних систем оброблення акустичної інформації для створення персоналізованого медіаконтенту. Зміст дисертаційного дослідження викладено в трьох розділах, де представлено та обґрунтовано основні результати роботи. Актуальність дисертаційної роботи обґрунтовано у вступі, де сформульовано мету та задачі дослідження, описано методи дослідження, надано інформацію про наукову новизну та практичне значення одержаних результатів. Об’єктом дослідження є різноманітний аудіо контент з записом живого або синтетично створеного голосового повідомлення на українській та англійській мовах. Застосування технологій оброблення акустичної інформації може бути спрямовано на забезпечення алгоритмів створення якісного персоналізованого медіаконтенту, наприклад для систем клонування голосу. У контексті цифрової трансформації суспільства важливість таких технологій останнім часом невпинно зростає, адже вони знаходять своє застосування у багатьох галузях, включаючи медицину, освіту, інформаційні системи, розваги та засоби комунікації. Одним із ключових аспектів роботи є застосування нейромережевих алгоритмів для оброблення акустичних сигналів. Використання нейронних мереж, як альтернативний спосіб, дозволяє отримати точну ідентифікацію голосу, реалізувати синтез природного мовлення та ефективне зменшення шуму і реверберації сигналів. Особливо актуальним це стає для систем, які працюють у складних акустичних умовах. Значний інтерес викликає завдання створення персоналізованого контенту, яке базується на здатності нейронних мереж адаптуватися до індивідуальних характеристик мовця. Це включає можливість збереження унікальних інтонацій, тембру та інших специфічних особливостей голосу. Крім того, задача підвищення розбірливості мовлення є важливою для поліпшення комунікації між користувачами у різних акустичних середовищах, серед яких це лекційні зали, офіси або відкриті простори. Зокрема, використання нейронних мереж дозволяє автоматизувати та покращувати процес обробки звукових сигналів, що є основою медіасистем. Такий підхід забезпечує можливість створювати персоналізований контент, який враховує, у тому числі, специфічні вподобання користувачів. У першому розділі розглянуто сучасний стан досліджень у галузі обробки акустичної інформації та створення персоналізованого медіаконтенту. Представлено загальні відомості про основні типи акустичних сигналів, які включають широке різноманіття звукових хвиль — від природних шумів до мовлення, музики та техногенних сигналів. Розкрито їх ключові характеристики, такі як амплітуда, частота, тривалість і спектральний склад, які формують базу для їх подальшого аналізу та обробки. Описано ключові технології, такі як згорткові нейронні мережі, рекурентні архітектури та їх застосування у задачах розпізнавання мовлення, синтезу голосу та зменшення шумів. Наведено приклади використання часово-частотного представлення сигналів (спектрограм, мел-спектрограм) для вилучення інформативних ознак з аудіоданих. Також наведено актуальні підходи до адаптації моделей до оброблення сигналів у складних акустичних умовах. Розглянуто методи оцінювання ефективності нейромережевих моделей, а також перспективи їхнього використання для персоналізації голосу в різних прикладних задачах. Ключові слова: розбірливість мовлення, оцінка, якість мовлення, тестовий сигнал, реверберація, шуми, моделювання, процес, звук, Інтернет речей, IoT, комп’ютерна система, рівень сигналу, розповсюдження сигналу. Дата реєстрації 2025-05-28 Додано в НРАТ 2025-05-28 Закрити
Дисертація доктор філос.
Борисов Гліб Олександрович. Адаптивні системи оброблення акустичної інформації для створення персоналізованого медіаконтенту
: Доктор філософії :
спец.. 171 - Електроніка :
дата захисту 2025-07-15; Статус: Наказ про видачу диплома;
Національний технічний університет України "Київський політехнічний інститут імені Ігоря Сікорського". – Київ, 0825U002000.
Знайдено документів: 1
Підписка
Повний текст наразі ще відсутній.
Повідомити вам про надходження повного тексту?
Повідомити вам про надходження повного тексту?
Оновлено: 2026-03-14
