Знайдено документів: 1
Інформація × Реєстраційний номер 2118U005280, Матеріали видань та локальних репозитаріїв Категорія Опубліковано, Стаття Назва роботи ЕФЕКТИВНИЙ АЛГОРИТМ ДЛЯ СИНТАКСИЧНОГО АНАЛІЗУ РЕЧЕНЬ З ВИКОРИСТАННЯМ СЕМАНТИЧНО ПОЗНАЧЕНИХ ЗВАЖЕНИХ АФІКСНИХ КОНТЕКСТНО-ВІЛЬНИХ ГРАМАТИК Автор Давидов М. В.Лозинська О. В.Пасічник В. В.Davydov M. V.Lozynska O. V.Pasichnyk V. V. Дата публікації 29-03-2018 Постачальник інформації Журнал "Радіоелектроніка, інформатика, управління" (Національний університет "Запорізька політехніка") Першоджерело https://ric.zp.edu.ua/article/view/126506 Видання National University "Zaporizhzhia Polytechnic" Опис Актуальність. Розглядається задача підвищення ефективності афіксних граматик над скінченною граткою (AGFL). AGFL – це контекстно-вільна граматика з гнучкими і компактними формами для розбору текстів на природних мовах.Мета роботи. Метою роботи є підвищення ефективності розбору речень за допомогою модифікації AGFL, яка додає семантичні атрибути в продукції граматики і вводить нову форму продукцій під назвою «шаблонна продукція». Ця модифікація допомагає зменшити кількість продукцій, необхідних для опису мови, і дозволяє зменшити обчислювальну складність алгоритму синтаксичного аналізу.Метод. Розроблено математичну модель шаблонної продукції і доведено теорему про те, що існує нормальна форма шаблонних продукцій, а процедура нормалізації породжує еквівалентну граматику. Нормальна форма використовується для підвищення ефективності розбору українських речень. Шаблонні продукції допомагають описувати правила на основі онтології в короткій і обчислювально ефективній формі. Вивчається нормальна форма шаблонних продукцій і пропонується ефективний алгоритм для розбору речень. У найгіршому випадку обчислювальна складність запропонованого алгоритму становить 0(n3 m3p mr), де n – довжина вхідного рядка терміналів, mp – максимальне число комбінацій символів і атрибутів, які можуть породжувати один і той самий рядок терміналів, mr – максимальне число продукцій, які мають той самий стартовий нетермінальний символ в правій частині. Час синтаксичного аналізу виявився майже лінійною функцією від кількості слів у реченні при розборі тестової бази речень української художньої літератури.Результати. Розроблений метод був реалізований в програмному забезпеченні UkrParser, яке доступне з відкритим вихідним кодом на GitHub.Висновки. Розроблений алгоритм був протестований на базі даних українських речень і продемонстрував в десять разів більшу швидкість розбору, ніж аналізатор «Stanford Parser». Майбутні дослідження можуть бути сфокусовані на розробці граматично доповнених онтологій для більш широкого набору предметних областей, що має поліпшити результати семантичного аналізу речень. Додано в НРАТ 2026-02-09 Закрити
Матеріали
Опубліковано
Стаття
Давидов М. В.. ЕФЕКТИВНИЙ АЛГОРИТМ ДЛЯ СИНТАКСИЧНОГО АНАЛІЗУ РЕЧЕНЬ З ВИКОРИСТАННЯМ СЕМАНТИЧНО ПОЗНАЧЕНИХ ЗВАЖЕНИХ АФІКСНИХ КОНТЕКСТНО-ВІЛЬНИХ ГРАМАТИК : публікація 2018-03-29; Журнал "Радіоелектроніка, інформатика, управління" (Національний університет "Запорізька політехніка"), 2118U005280
Знайдено документів: 1

Оновлено: 2026-03-16