1 documents found
Information × Registration Number 0825U002000, PhD dissertation Status Доктор філософії Date 15-07-2025 popup.evolution o Title Adaptive acoustic information processing systems for creating personalized media content Author Hlib Borysov, popup.head Kyrylo O. Trapezon popup.opponent Oleksandr Mozhaiev popup.opponent Halyna I. Sokol popup.review Oleksandr I. Drozdenko popup.review Alex Grebin Description Борисов Г.О. Адаптивні системи оброблення акустичної інформації для створення персоналізованого медіаконтенту. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії у галузі знань 17 – Електроніка та телекомунікації за спеціальністю 171 «Електроніка». – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», МОН України, Київ, 2025. Дисертаційна робота присвячена дослідженню адаптивних систем оброблення акустичної інформації для створення персоналізованого медіаконтенту. Зміст дисертаційного дослідження викладено в трьох розділах, де представлено та обґрунтовано основні результати роботи. Актуальність дисертаційної роботи обґрунтовано у вступі, де сформульовано мету та задачі дослідження, описано методи дослідження, надано інформацію про наукову новизну та практичне значення одержаних результатів. Об’єктом дослідження є різноманітний аудіо контент з записом живого або синтетично створеного голосового повідомлення на українській та англійській мовах. Застосування технологій оброблення акустичної інформації може бути спрямовано на забезпечення алгоритмів створення якісного персоналізованого медіаконтенту, наприклад для систем клонування голосу. У контексті цифрової трансформації суспільства важливість таких технологій останнім часом невпинно зростає, адже вони знаходять своє застосування у багатьох галузях, включаючи медицину, освіту, інформаційні системи, розваги та засоби комунікації. Одним із ключових аспектів роботи є застосування нейромережевих алгоритмів для оброблення акустичних сигналів. Використання нейронних мереж, як альтернативний спосіб, дозволяє отримати точну ідентифікацію голосу, реалізувати синтез природного мовлення та ефективне зменшення шуму і реверберації сигналів. Особливо актуальним це стає для систем, які працюють у складних акустичних умовах. Значний інтерес викликає завдання створення персоналізованого контенту, яке базується на здатності нейронних мереж адаптуватися до індивідуальних характеристик мовця. Це включає можливість збереження унікальних інтонацій, тембру та інших специфічних особливостей голосу. Крім того, задача підвищення розбірливості мовлення є важливою для поліпшення комунікації між користувачами у різних акустичних середовищах, серед яких це лекційні зали, офіси або відкриті простори. Зокрема, використання нейронних мереж дозволяє автоматизувати та покращувати процес обробки звукових сигналів, що є основою медіасистем. Такий підхід забезпечує можливість створювати персоналізований контент, який враховує, у тому числі, специфічні вподобання користувачів. У першому розділі розглянуто сучасний стан досліджень у галузі обробки акустичної інформації та створення персоналізованого медіаконтенту. Представлено загальні відомості про основні типи акустичних сигналів, які включають широке різноманіття звукових хвиль — від природних шумів до мовлення, музики та техногенних сигналів. Розкрито їх ключові характеристики, такі як амплітуда, частота, тривалість і спектральний склад, які формують базу для їх подальшого аналізу та обробки. Описано ключові технології, такі як згорткові нейронні мережі, рекурентні архітектури та їх застосування у задачах розпізнавання мовлення, синтезу голосу та зменшення шумів. Наведено приклади використання часово-частотного представлення сигналів (спектрограм, мел-спектрограм) для вилучення інформативних ознак з аудіоданих. Також наведено актуальні підходи до адаптації моделей до оброблення сигналів у складних акустичних умовах. Розглянуто методи оцінювання ефективності нейромережевих моделей, а також перспективи їхнього використання для персоналізації голосу в різних прикладних задачах. Ключові слова: розбірливість мовлення, оцінка, якість мовлення, тестовий сигнал, реверберація, шуми, моделювання, процес, звук, Інтернет речей, IoT, комп’ютерна система, рівень сигналу, розповсюдження сигналу. Registration Date 2025-05-28 popup.nrat_date 2025-05-28 Close
PhD dissertation
Hlib Borysov. Adaptive acoustic information processing systems for creating personalized media content
: Доктор філософії :
spec.. 171 - Електроніка :
presented. 2025-07-15; popup.evolution: o;
National Technical University of Ukraine «Igor Sikorsky Kyiv Polytechnic Institute». – Київ, 0825U002000.
1 documents found
search.subscribing
search.subscribe_text
Updated: 2026-03-21
