1 documents found
Information × Registration Number 0824U001387, PhD dissertation Status Доктор філософії Date 22-04-2024 popup.evolution . Title Information technologies for formation and analysis of network models of subject domains based on linguostatistical approach Author Dmytrenko Oleg Oleksandrovych, popup.head Dmytro Lande popup.head Vitaliy Tsyganok popup.opponent Oleksandr Stryzhak popup.opponent Julia Rogushina popup.review Andriy Kryuchyn popup.review Iryna Balagura Description Дмитренко О.О. Інформаційні технології формування та аналізу мережевих моделей предметних галузей на основі лігвостатистичного підходу. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 122 «Комп’ютерні науки». – Інститут проблем реєстрації інформації, НАН України, Київ, 2024. У дисертаційній роботі представлені результати проведених здобувачем досліджень, які виконують актуальне наукове завдання формування та аналізу мережевих моделей предметних галузей на основі лінгвостатистичного підходу обробки тематичних текстових даних та інформаційних потоків. Актуальність цього дослідження пов’язана з тим, що з початком стрімкого розвитку інформаційно-комунікаційних технологій та глобалізацією інформаційного простору розпочалося стрімке збільшення інформаційних ресурсів, що розподілені у вебмережі. Їх розвиток відбувається куди швидше, ніж коли-небуть раніше. І як наслідок, це призвело до збільшення динамічних інформаційних потоків і, відповідно, стрімкого збільшенням об’ємів даних, представлених у електронному вигляді. Важливо зазначити й той факт, що обсяг вищезгаданих даних подвоюється приблизно кожні 18 місяців. І наразі у глобальній мережі Інтернет налічується більше сотні трильйонів документів, і частина з них – це величезні масиви текстових даних, аналіз яких може дати критично важливу інформацію. Та з експоненційним збільшенням інформаційних потоків зростає і частка неструктурованих або слабоструктурованих даних, що, безперечно, ускладнює пошук необхідної та релевантної інформації. Наприклад, основна частина таких даних (близько 95%) є неструктурованими, і лише зовсім мала (близько 5%) – це різні бази даних, де зберігається структурована інформація, яка може бути використана під час прийняття рішень. Тож перед інформаційним суспільством постає також і ряд специфічних проблем, пов’язаних зокрема з критичною невідповідністю між розвитком сучасних інформаційних систем і збільшенням динамічних інформаційних потоків у глобальних комп’ютерних мережах. А тому питання подальшої комп’ютеризованої обробки текстових даних з метою екстрагування знань та подальшої їх структуризації є важливим та актуальним у сучасному інформаційному середовищі. Метою дисертаційної роботи є розробити нові методи формування мережевих моделей предметних галузей на основі текстових корпусів і лігвостатистичного аналізу текстів та розробити нові методи аналізу побудованих мереж для того, щоб приймати ефективні рішення у відповідних предметних галузях, з якими змістовно пов’язані тексти. Дисертаційна робота спрямована на вдосконалення і розширення існуючих підходів до моделювання мережевої структури предметних галузей на основі лінгвістичних даних. Основні завдання включають розробку алгоритмів побудови мереж, які враховують специфіку текстових даних, а також розробку методів аналізу отриманих мереж з метою виявлення ключових зв'язків та характеристик, які допоможуть у прийнятті обґрунтованих рішень у відповідних галузях заснованих на досліджуваних текстових даних. Об’єктом дослідження є процес структуризації у вигляді мережевих моделей текстових інформаційних потоків, розподілених у вебмережі. Предметом дослідження є лінгвостатистичні методи формування та аналізу мережевих моделей предметних галузей на основі текстових корпусів. Для вирішення проблеми та поставлених задач для досягнення мети були використані наступні наукові методи: методи автоматичної обробки та аналізу природної мови та методи комп’ютерної лінгвістики, завдяки яким проводилась попередня комп'ютеризована обробка природномовних текстів, лексичний аналіз та виявлення семантичних зв'язків; методи статистичного аналізу, що застосовувались для виокремлення ключових термінів (слів та словосполучень) із текстових даних; та методи дискретної математики, зокрема, методи теорії графів та складних мереж, завдяки яким здійснювалась побудова мережевих моделей предметних галузей та подальше дослідження й аналіз отриманих моделей. У дисертаційній роботі проведено огляд та аналіз сучасних лінгвостатистичних методів, що застосовуються для структуризації текстових даних шляхом побудови мережевих моделей предметних галузей. Також описано методи та алгоритми аналізу мережевих структур і підходи до комп'ютеризованої обробки та аналізу текстових документів. Крім цього було акцентовано увагу й на проблемах, які можуть виникати під час використання методів статистичного зважування. Детально розглянуто основні рівні лінгвістичної обробки тестових даних. Розглянуто основні ідеї семантичного пошуку, як одного із найперспективніших видів автоматизованого повнотекстового інформаційного пошуку. Registration Date 2024-04-01 popup.nrat_date 2024-04-01 Close
PhD dissertation
Dmytrenko Oleg Oleksandrovych. Information technologies for formation and analysis of network models of subject domains based on linguostatistical approach
: Доктор філософії :
spec.. 122 - Комп’ютерні науки :
presented. 2024-04-22; popup.evolution: .;
Institute for Information Recording NASU. – Київ, 0824U001387.
1 documents found
search.subscribing
search.subscribe_text
Updated: 2026-03-22
