Знайдено документів: 1
Інформація × Реєстраційний номер 2124U009245, Матеріали видань та локальних репозитаріїв Категорія Опубліковано, Стаття Назва роботи СТВОРЕННЯ МАСШТАБОВАНОГО НАБОРУ ДАНИХ ДЛЯ П’ЯТНИЧНИХ ПРОПОВІДЕЙ З АУДІО ТА ТЕКСТУ (ПАТ) Автор Самах А. А.Дімах Х. А.Хасанін М. А.Samah A. A.Dimah H. A.Hassanin M. A. Дата публікації 27-06-2024 Постачальник інформації Журнал "Радіоелектроніка, інформатика, управління" (Національний університет "Запорізька політехніка") Першоджерело https://ric.zp.edu.ua/article/view/305855 Видання National University "Zaporizhzhia Polytechnic" Опис Актуальність. Сьогодні збір і створення наборів даних у різних секторах стає все більш поширеним. Незважаючи на таке поширене створення даних, досі існує прогалина в спеціалізованих областях, зокрема в області Ісламських п’ятничних проповідей. Вона багата на теологічні, культурні та лінгвістичні дослідження, які стосуються арабських і мусульманських країн, а не лише релігійних дискурсів. Мета. Мета цього дослідження полягає в тому, щоб усунути цю нестачу, створивши повний набір даних аудіо та тексту проповідей із його метаданими. Це спрямоване надати великий ресурс для вивчення релігії, лінгвістики та соціології. Крім того, це дозволить підтримати досягнення у сфері штучного інтелекту, таких як технології обробки природної мови та розпізнавання мовлення. Метод. Розробка набору даних проходила у чотири окремі етапи: планування, створення та обробка, вимірювання та розгортання. Набір даних містить колекцію з 21 253 аудіо та відповідних файлів розшифровки, які були успішно створені. Удосконалені методи обробки звуку були використані для покращення розпізнавання мовлення та надання набору даних, який підходить для широкого використання. Результати. Тонко налаштований набір даних досяг 5,13% частоти помилок у словах (Word Error Rate – WER), що вказує на значне покращення точності, порівняно з базовою моделлю Microsoft Azure Speech. Це досягнення вказує на якість набору даних і ефективність використовуваних методів обробки. У світлі цього було розроблено новий алгоритм фрази з найбільшою відповідністю, щоб підвищити високу надійність еквівалентного мовлення до тексту шляхом коригування фраз із меншим співвідношенням. Висновки. Це дослідження створює ресурс для поєднання різних досліджень, таких як релігієзнавство, лінгвістика та соціологія. Крім того, воно демонструє потенціал у сфері штучного інтелекту і підтримує його програми. У майбутніх дослідженнях ми зосередимося на збагаченні цього розширення набору даних шляхом додавання відеокорпусу мовою жестів, використовуючи вдосконалені методи вирівнювання. Він підтримуватиме поточні розробки машинного перекладу для ширшого розуміння ісламських п’ятничних проповідей у різних мовах і культурах. Додано в НРАТ 2026-02-25 Закрити
Матеріали
Опубліковано
Стаття
Самах А. А.. СТВОРЕННЯ МАСШТАБОВАНОГО НАБОРУ ДАНИХ ДЛЯ П’ЯТНИЧНИХ ПРОПОВІДЕЙ З АУДІО ТА ТЕКСТУ (ПАТ) : публікація 2024-06-27; Журнал "Радіоелектроніка, інформатика, управління" (Національний університет "Запорізька політехніка"), 2124U009245
Знайдено документів: 1

Оновлено: 2026-03-14