Знайдено документів: 1
Інформація × Реєстраційний номер 0824U001387, Дисертація доктора філософії На здобуття Доктор філософії Дата захисту 22-04-2024 Статус Захищена Назва роботи Інформаційні технології формування та аналізу мережевих моделей предметних галузей на основі лінгвостатистичного підходу Здобувач Дмитренко Олег Олександрович, Керівник Ланде Дмитро Володимирович Керівник Циганок Віталій Володимирович Опонент Стрижак Олександр Євгенійович Опонент Рогушина Юлія Віталіївна Рецензент Крючин Андрій Андрійович Рецензент Балагура Ірина Валеріївна Опис Дмитренко О.О. Інформаційні технології формування та аналізу мережевих моделей предметних галузей на основі лігвостатистичного підходу. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 122 «Комп’ютерні науки». – Інститут проблем реєстрації інформації, НАН України, Київ, 2024. У дисертаційній роботі представлені результати проведених здобувачем досліджень, які виконують актуальне наукове завдання формування та аналізу мережевих моделей предметних галузей на основі лінгвостатистичного підходу обробки тематичних текстових даних та інформаційних потоків. Актуальність цього дослідження пов’язана з тим, що з початком стрімкого розвитку інформаційно-комунікаційних технологій та глобалізацією інформаційного простору розпочалося стрімке збільшення інформаційних ресурсів, що розподілені у вебмережі. Їх розвиток відбувається куди швидше, ніж коли-небуть раніше. І як наслідок, це призвело до збільшення динамічних інформаційних потоків і, відповідно, стрімкого збільшенням об’ємів даних, представлених у електронному вигляді. Важливо зазначити й той факт, що обсяг вищезгаданих даних подвоюється приблизно кожні 18 місяців. І наразі у глобальній мережі Інтернет налічується більше сотні трильйонів документів, і частина з них – це величезні масиви текстових даних, аналіз яких може дати критично важливу інформацію. Та з експоненційним збільшенням інформаційних потоків зростає і частка неструктурованих або слабоструктурованих даних, що, безперечно, ускладнює пошук необхідної та релевантної інформації. Наприклад, основна частина таких даних (близько 95%) є неструктурованими, і лише зовсім мала (близько 5%) – це різні бази даних, де зберігається структурована інформація, яка може бути використана під час прийняття рішень. Тож перед інформаційним суспільством постає також і ряд специфічних проблем, пов’язаних зокрема з критичною невідповідністю між розвитком сучасних інформаційних систем і збільшенням динамічних інформаційних потоків у глобальних комп’ютерних мережах. А тому питання подальшої комп’ютеризованої обробки текстових даних з метою екстрагування знань та подальшої їх структуризації є важливим та актуальним у сучасному інформаційному середовищі. Метою дисертаційної роботи є розробити нові методи формування мережевих моделей предметних галузей на основі текстових корпусів і лігвостатистичного аналізу текстів та розробити нові методи аналізу побудованих мереж для того, щоб приймати ефективні рішення у відповідних предметних галузях, з якими змістовно пов’язані тексти. Дисертаційна робота спрямована на вдосконалення і розширення існуючих підходів до моделювання мережевої структури предметних галузей на основі лінгвістичних даних. Основні завдання включають розробку алгоритмів побудови мереж, які враховують специфіку текстових даних, а також розробку методів аналізу отриманих мереж з метою виявлення ключових зв'язків та характеристик, які допоможуть у прийнятті обґрунтованих рішень у відповідних галузях заснованих на досліджуваних текстових даних. Об’єктом дослідження є процес структуризації у вигляді мережевих моделей текстових інформаційних потоків, розподілених у вебмережі. Предметом дослідження є лінгвостатистичні методи формування та аналізу мережевих моделей предметних галузей на основі текстових корпусів. Для вирішення проблеми та поставлених задач для досягнення мети були використані наступні наукові методи: методи автоматичної обробки та аналізу природної мови та методи комп’ютерної лінгвістики, завдяки яким проводилась попередня комп'ютеризована обробка природномовних текстів, лексичний аналіз та виявлення семантичних зв'язків; методи статистичного аналізу, що застосовувались для виокремлення ключових термінів (слів та словосполучень) із текстових даних; та методи дискретної математики, зокрема, методи теорії графів та складних мереж, завдяки яким здійснювалась побудова мережевих моделей предметних галузей та подальше дослідження й аналіз отриманих моделей. У дисертаційній роботі проведено огляд та аналіз сучасних лінгвостатистичних методів, що застосовуються для структуризації текстових даних шляхом побудови мережевих моделей предметних галузей. Також описано методи та алгоритми аналізу мережевих структур і підходи до комп'ютеризованої обробки та аналізу текстових документів. Крім цього було акцентовано увагу й на проблемах, які можуть виникати під час використання методів статистичного зважування. Детально розглянуто основні рівні лінгвістичної обробки тестових даних. Розглянуто основні ідеї семантичного пошуку, як одного із найперспективніших видів автоматизованого повнотекстового інформаційного пошуку. Дата реєстрації 2024-04-01 Додано в НРАТ 2024-04-01 Закрити
Дисертація доктор філос.
Дмитренко Олег Олександрович. Інформаційні технології формування та аналізу мережевих моделей предметних галузей на основі лінгвостатистичного підходу
: Доктор філософії :
спец.. 122 - Комп’ютерні науки :
дата захисту 2024-04-22; Статус: Захищена;
Інститут проблем реєстрації інформації Національної академії наук України. – Київ, 0824U001387.
Знайдено документів: 1
Підписка
Повний текст наразі ще відсутній.
Повідомити вам про надходження повного тексту?
Повідомити вам про надходження повного тексту?
Оновлено: 2026-03-15
