Знайдено документів: 1
Інформація × Реєстраційний номер 2124U009276, Матеріали видань та локальних репозитаріїв Категорія Опубліковано, Стаття Назва роботи ТЕХНОЛОГІЯ АВТОМАТИЗОВАНОГО ПОБУДУВАННЯ СЛОВНИКІВ ПРЕДМЕТНОЇ ГАЛУЗІ ЗІ СПЕЦІАЛЬНОЮ ОБРОБКОЮ КОРОТКИХ ДОКУМЕНТІВ Автор Кунгурцев О. Б.Милейко І. І.Новікова Н. О.Kungurtsev O. B.Mileiko I. I.Novikova N. O. Дата публікації 04-01-2024 Постачальник інформації Журнал "Радіоелектроніка, інформатика, управління" (Національний університет "Запорізька політехніка") Першоджерело https://ric.zp.edu.ua/article/view/296240 Видання National University "Zaporizhzhia Polytechnic" Опис Актуальність. Розглянуто завдання автоматизації побудови словників предметної галузі у процесі виконання програмних проектів на основі аналізу документів з урахуванням їх розміру та форми подання. Мета роботи – підвищення якості словника на основі застосування нової технології, що включає спеціальну обробку коротких документів. Метод. Пропонується модель короткого документа, яка представляє його у вигляді трьох частин: заголовної, змістовної та заключної. У заголовній і заключній частинах зазвичай міститься інформація, що не має відношення до предметної області. Тому запропоновано метод виділення змістовної частини, заснований на використанні множини ключових слів. Розмір короткого документа (його змістовної частини) не дозволяє визначити частотні характеристики слів і виявити багатослівні терміни, частка яких сягає 50% від усіх термінів. Для забезпечення можливості виділення термінів у коротких документах запропоновано метод їх кластеризації, заснований на виділенні іменників та обчисленні їх частотних характеристик. Утворені кластери розглядаються як звичайні документи, оскільки їхній розмір дозволяє виділяти багатослівні терміни. Для виділення термінів запропоновано виділяти в тексті послідовності слів, що містять іменники. Аналіз частот повторення таких послідовностей дозволяє визначити багатослівні терміни. Для визначення тлумачення термінів використано раніше розроблений метод автоматизованого пошуку тлумачень у словниках. Результати. На основі запропонованої моделі та методів створено програмне забезпечення для побудови словника предметної галузі та проведено низку експериментів, що підтверджують ефективність розроблених рішень. Висновки. Проведені експерименти підтвердили працездатність запропонованого програмного забезпечення та дозволяють рекомендувати його до використання на практиці для створення словників предметної галузі різних інформаційних систем. Перспективи подальших досліджень можуть включати побудову корпоративних пошукових систем на основі словників термінів та кластеризації документів.  Додано в НРАТ 2026-02-27 Закрити
Матеріали
Опубліковано
Стаття
Кунгурцев О. Б.. ТЕХНОЛОГІЯ АВТОМАТИЗОВАНОГО ПОБУДУВАННЯ СЛОВНИКІВ ПРЕДМЕТНОЇ ГАЛУЗІ ЗІ СПЕЦІАЛЬНОЮ ОБРОБКОЮ КОРОТКИХ ДОКУМЕНТІВ : публікація 2024-01-04; Журнал "Радіоелектроніка, інформатика, управління" (Національний університет "Запорізька політехніка"), 2124U009276
Знайдено документів: 1

Оновлено: 2026-02-28