Знайдено документів: 1
Інформація × Реєстраційний номер 0219U003681, 0117U004726 , Науково-дослідна робота Назва роботи Розробка моделей та методів ідентифікації процесів екстракції знань у слабко структурованих масивах інформації Назва етапу роботи Керівник роботи Шаронова Наталія Валеріївна, Дата реєстрації 08-02-2019 Організація виконавець Національний технічний університет "Харківський політехнічний інститут" Опис етапу Об'єкт дослідження - процеси екстракції знань у слабко структурованих текстових масивах інформації. Мета роботи - розробка моделей, методів та інформаційних технологій інтелектуальної обробки даних та предметних знань для автоматизованої ідентифікації процесів екстракції знань у слабо структурованих масивах інформації. Методи дослідження базуються на комплексному використанні методів теорії інтелекту, апарату алгебри відношень та алгебри операцій над відношеннями, алгебри предикатних операцій та алгебри підстановних операцій, методу компараторної ідентифікації, теоретичних засад та практичних методів комп'ютерної лексикографії, квантитативної та корпусної лінгвістики. Розроблено методи та створено інформаційні технології автоматичного видобування з текстів предметної області лексикографічних одиниць та іменованих сутностей. Створено робочий корпус для вилучення іменованих сутностей української мови. Розроблено спеціальне інформаційно-лексикографічне забезпечення вирішення задачі вилучення іменованих сутностей української мови. Для проведення експериментальних досліджень створено прототипи програм для автоматичного вилучення лексикографічних одиниць та іменованих сутностей. Оцінку ефективності здійснено окремо для двох основних задач, які вирішуються у дослідженні: задачі видобування термінів предметної області з текстів та задачі видобування іменованих сутностей. Для першої задачі Recall = 0,89, Precision = 0,94, для другої - Recall = 0,67, Precision = 0,89. Порівняння отриманих результатів з результатами подібних систем показали ефективність роботи інформаційних систем щодо вирішення представлених двох задач, а також підтверджують відмінні переваги отриманих результатів запропонованих моделей та інформаційних технологій у проведеному аналізі в порівнянні з вітчизняними й зарубіжними аналогами. Отримані результати можуть бути використані у вигляді математичного, алгоритмічного, інформаційного, програмного та іншого забезпечення системи автоматизованого створення лексикографічних ресурсів різного призначення, а також системи автоматизованого видобування іменованих сутностей. Одержані у дослідженні результати впроваджено у вигляді пакетів прикладних програм для створення галузевих інформаційних ресурсів, у тому числі лексикографічних, здійснення тематичного, патентного та інформаційного пошуку. Опис продукції Розроблено інформаційну систему автоматизованого формування лексикографічних ресурсів, а саме термінологічного словника предметної області та словника синонімів термінів предметної області, система також виконує задачу автоматизованого видобування термінів предметної області з текстів. Розроблено інформаційну систему автоматизованого видобування іменованих сутностей з текстів. Інформаційні системи можуть використовуватися для створення галузевих інформаційних ресурсів, у тому числі лексикографічних, здійснення тематичного, патентного та інформаційного пошуку. Автори роботи Бабкова Надія Вікторівна Борисова Наталя Володимирівна Гулієва Діна Олександрівна Каніщева Ольга Валеріївна Кочуєва Зоя Анатоліївна Купріянов Євген Валерійович Оробінська Олена Олександрівна Петрасова Світлана Валентинівна Хайрова Ніна Феліксівна Шабанова-Кушнаренко Любов Володимирівна Шаронова Наталія Валеріївна Додано в НРАТ 2020-04-02 Закрити
НДДКР ОК
Керівник: Шаронова Наталія Валеріївна. Розробка моделей та методів ідентифікації процесів екстракції знань у слабко структурованих масивах інформації. (Етап: ). Національний технічний університет "Харківський політехнічний інститут". № 0219U003681
Знайдено документів: 1
Підписка
Повний текст наразі ще відсутній.
Повідомити вам про надходження повного тексту?
Повідомити вам про надходження повного тексту?
Оновлено: 2026-03-19
