ЕФЕКТИВНИЙ АЛГОРИТМ ДЛЯ СИНТАКСИЧНОГО АНАЛІЗУ РЕЧЕНЬ З ВИКОРИСТАННЯМ СЕМАНТИЧНО ПОЗНАЧЕНИХ ЗВАЖЕНИХ АФІКСНИХ КОНТЕКСТНО-ВІЛЬНИХ ГРАМАТИК

1 documents found

Information × Registration Number 2118U005280, Article popup.category Опубліковано, Стаття Title EFFECTIVE ALGORITHM FOR PARSING SENTENCES USING SEMANTICALLY ATTRIBUTED WEIGHTED AFFIX CONTEXT FREE popup.author Давидов М. В.Лозинська О. В.Пасічник В. В.Davydov M. V.Lozynska O. V.Pasichnyk V. V. popup.publication 29-03-2018 popup.source_user Журнал "Радіоелектроніка, інформатика, управління" (Національний університет "Запорізька політехніка") popup.source https://ric.zp.edu.ua/article/view/126506 popup.publisher National University "Zaporizhzhia Polytechnic" Description Актуальність. Розглядається задача підвищення ефективності афіксних граматик над скінченною граткою (AGFL). AGFL – це контекстно-вільна граматика з гнучкими і компактними формами для розбору текстів на природних мовах.Мета роботи. Метою роботи є підвищення ефективності розбору речень за допомогою модифікації AGFL, яка додає семантичні атрибути в продукції граматики і вводить нову форму продукцій під назвою «шаблонна продукція». Ця модифікація допомагає зменшити кількість продукцій, необхідних для опису мови, і дозволяє зменшити обчислювальну складність алгоритму синтаксичного аналізу.Метод. Розроблено математичну модель шаблонної продукції і доведено теорему про те, що існує нормальна форма шаблонних продукцій, а процедура нормалізації породжує еквівалентну граматику. Нормальна форма використовується для підвищення ефективності розбору українських речень. Шаблонні продукції допомагають описувати правила на основі онтології в короткій і обчислювально ефективній формі. Вивчається нормальна форма шаблонних продукцій і пропонується ефективний алгоритм для розбору речень. У найгіршому випадку обчислювальна складність запропонованого алгоритму становить 0(n3 m3p mr), де n – довжина вхідного рядка терміналів, mp – максимальне число комбінацій символів і атрибутів, які можуть породжувати один і той самий рядок терміналів, mr – максимальне число продукцій, які мають той самий стартовий нетермінальний символ в правій частині. Час синтаксичного аналізу виявився майже лінійною функцією від кількості слів у реченні при розборі тестової бази речень української художньої літератури.Результати. Розроблений метод був реалізований в програмному забезпеченні UkrParser, яке доступне з відкритим вихідним кодом на GitHub.Висновки. Розроблений алгоритм був протестований на базі даних українських речень і продемонстрував в десять разів більшу швидкість розбору, ніж аналізатор «Stanford Parser». Майбутні дослідження можуть бути сфокусовані на розробці граматично доповнених онтологій для більш широкого набору предметних областей, що має поліпшити результати семантичного аналізу речень. popup.nrat_date 2026-02-09 Close

Article

Опубліковано

Стаття

EFFECTIVE ALGORITHM FOR PARSING SENTENCES USING SEMANTICALLY ATTRIBUTED WEIGHTED AFFIX CONTEXT FREE

Давидов М. В.. EFFECTIVE ALGORITHM FOR PARSING SENTENCES USING SEMANTICALLY ATTRIBUTED WEIGHTED AFFIX CONTEXT FREE : published. 2018-03-29; Журнал "Радіоелектроніка, інформатика, управління" (Національний університет "Запорізька політехніка"), 2118U005280

1 documents found

Updated: 2026-03-24

Роздрукувати цю сторінку

National Repository of Academic Texts

The NRAT database:

Reports in the field of scientific and scientific and technical activities

Dissertations for obtaining scientific degrees and abstracts

Materials from publications and local repositories

Search academic texts