1 documents found
Information × Registration Number 2225U001723, Qualification work popup.category Магістерська робота Title popup.author Нагорна Марія Дмитрівна popup.publication 01-01-2025 popup.source_user Запорізький національний університет popup.source https://dspace.znu.edu.ua/jspui/handle/12345/30983 popup.publisher Description UA : Робота викладена на 60 сторінках друкованого тексту, містить 21 рисунок, 1 таблицю, 24 джерела, 4 додатки. Об’єкт дослідження – процес розпізнавання психоемоційного стану людини за звуковими характеристиками її голосу. Мета роботи – дослідження та порівняльний аналіз технологій машинного навчання для розпізнавання психоемоційного стану людини. Методи дослідження – аналіз предметної області, визначення вимог, цифрова обробка сигналів. У процесі дослідження систем розпізнавання емоцій було проаналізовано предметну область та визначено основні характеристики голосу, що впливають на виявлення настрою. Програмну реалізацію виконано мовою Python із використанням бібліотек Librosa для обробки звуку та TensorFlow з PyTorch для створення нейромереж. Розроблено та протестовано дві різні моделі: згорткову мережу, що працює зі спектрограмами, та трансформер. Проведено експерименти на студійних записах та на власному наборі даних українською мовою. З’ясовано, що модель Wav2Vec 2.0 значно краще справляється з шумами та розпізнаванням емоцій у новій мові, тоді як CNN підходить лише для ідеальних умов. Результати роботи можуть бути використані для створення розумних голосових помічників. Подальший розвиток передбачає покращення точності роботи з українською мовою. EN : The work is presented on 60 pages of printed text, 21 figure, 1 tables, 24 references, 4 annexes. Object of the study – the process of recognizing a person's psycho-emotional state based on the acoustic characteristics of their voice. Aim of the study – research and comparative analysis of machine learning technologies for recognizing a person's psycho-emotional state. Method of research – subject area analysis, requirements definition, digital signal processing. In the process of researching emotion recognition systems, the subject area was analyzed and the main characteristics of the voice that influence mood detection were identified. The software implementation was performed in Python using the Librosa library for sound processing and TensorFlow with PyTorch for creating neural networks. Two different models were developed and tested: a convolutional network that works with spectrograms and a transformer. Experiments were conducted on studio recordings and on our own dataset in Ukrainian. It was found that the Wav2Vec 2.0 model copes much better with noise and emotion recognition in a new language, while CNN is only suitable for ideal conditions. The results of the work can be used to create smart voice assistants. Further development involves improving the accuracy of working with the Ukrainian language. popup.nrat_date 2026-04-29 Close
search.res_vnz
Нагорна Марія Дмитрівна. :
published. 2025-01-01;
Запорізький національний університет, 2225U001723
1 documents found
search.subscribing
search.subscribe_text
Updated: 2026-04-30
