1 documents found
Information × Registration Number 2118U005315, Article popup.category Опубліковано, Стаття Title THE AUTOMATIC SPEAKER RECOGNITION SYSTEM OF CRITICAL USE CLASSIFIER OPTIMIZATION popup.author Бісікало О. В.Грищук Т. В.Ковтун В. В.Bisikalo O. VGrischuk T. V.Kovtun V. V. popup.publication 04-10-2018 popup.source_user Журнал "Радіоелектроніка, інформатика, управління" (Національний університет "Запорізька політехніка") popup.source https://ric.zp.edu.ua/article/view/142611 popup.publisher National University "Zaporizhzhia Polytechnic" Description Актуальність. Розглянуто питання адаптації згортального нейромережевого класифікатора для використання у автоматизованісистемі розпізнавання мовців критичного застосування (АСРМКЗ). Об’єктом дослідження є індивідуальні особливості мовногопроцесу людини.Мета роботи. Розроблення заходів по виділенню з мовного сигналу індивідуальних для мовця ознак, підвищення їх інформативностів результаті виконання факторного аналізу, їх візуальне представлення для використання згортального нейромережевого класифікатора та оптимізація його архітектури для потреб АСРМКЗ.Метод. Запропоновано заходи по оптимізації процедури класифікації мовців АСРМКЗ, для чого теоретично обґрунтованооптимальний спосіб представлення інформативних ознак і метод підвищення їх інформативності, обґрунтовано вид топологію ізаходи для підвищення ефективності процесу розпізнавання мовців. Зокрема, обґрунтовано доцільність використання нормалізованихза потужністю кепстральних коефіцієнтів PNCC для опису фонограм, записаних в умовах шумного оточення, запропоновановикористовувати фільтри Габора для представлення інформації, що аналізуватиметься згортальною нейромережею, вибранооптимальний метод факторного аналізу, а саме, розріджений метод аналізу головних компонент, для зменшення розмірності векторуознак із збереженням його інформативності, запропоновано удосконалену топологію згортальної нейромережі для АСРМКЗ, у якійфільтри Габора інтегровано у згортальний шар, що дозволяє оптимізувати їх параметри при навчанні нейромережі, і на повнозв’язному шарі використано глибоку нейромережу із bottleneck-шаром, ваги якого після навчання використано як вхідні дані для контрольного GMM/HMM-класифікатора.Результати. Методи представлення та оптимізації інформативних для розпізнавання мовця ознак, методи їх візуальногопредставлення та удосконалення топології згортальної нейромережі для прийняття рішень на їх основі.Висновки. Отримані теоретичні результати знайшли емпіричного підтвердження. Зокрема, доведено стійкість удосконаленоїзгортальної нейромережі до присутності шумів оточення у вхідних фонограмах, яка виявилася вищою за показники звичайноїзгортальної нейромережі та глибокої нейромережі. При зростанні ВСШ>10 дБ контрольний GMM/HMM-класифікатор виявивсяефективнішим за нейромережеві щодо імовірності прального розпізнавання мовців, що можна пояснити ефективністю використаноїUBM-моделі, але він є і суттєво ресурсоємнішим. Також емпірично виявлено вікна банку фільтрів Габора, які надавали найбільшваріативну щодо індивідуальних особливостей мовлення, інформацію. popup.nrat_date 2026-02-09 Close
Article
Опубліковано
Стаття
Бісікало О. В.. THE AUTOMATIC SPEAKER RECOGNITION SYSTEM OF CRITICAL USE CLASSIFIER OPTIMIZATION : published. 2018-10-04; Журнал "Радіоелектроніка, інформатика, управління" (Національний університет "Запорізька політехніка"), 2118U005315
1 documents found

Updated: 2026-03-18