Знайдено документів: 1
Інформація × Реєстраційний номер 0216U001545, 0115U000967 , Науково-дослідна робота Назва роботи Розробка розподілених інформаційно-аналітичних систем для категоризації великих обсягів неструктурованих даних Назва етапу роботи Керівник роботи Панкратова Наталія Дмитрівна, Доктор технічних наук Дата реєстрації 18-02-2016 Організація виконавець Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" Опис етапу Об'єктом дослідження є інформаційний простір, зокрема, документи та взаємні зв'язки між ними, що формують у часі причино наслідкові ситуації динаміки життя суспільства та впливають на прийняття рішень, особливо масштабу країни. Мета роботи полягає у розробці методології створення сучасних наукових та інженерних засад архітектури розподілених систем для застосування засобів визначення тематики та класифікації елементів неструктурованих джерел даних. Створена методологія дозволить побудувати хмаринний сервіс щодо онлайн-аналізу тематики неструктурованих джерел для видобуття, аналізу та агрегації слабко структурованих знань, що можуть бути застосовані у системах аналізу та підтримки законотворчих та інших рішень. Ефективна категоризація неструктурованих джерел дозволить обґрунтовано розподіляти інформаційні потоки для подальшої обробки неструктурованих даних. Розроблено підхід до побудови і початкового оцінювання морфологічних таблиць для модифікованого методу морфологічного аналізу на основі результатів класифікації і аналізу семантичної забарвленості фрагментів інформації. Такий підхід дозволить залучати потужний метод якісного аналізу для дослідження слабко структурованих об'єктів у вигляді морфологічних моделей. Створені засади дозволять значно підвищити конкурентоспроможність та обороноспроможність держави у галузі інформаційних технологій аналізу інформаційного впливу на законотворчі, управлінські та економічні рішення. Опис продукції Методика розподіленої категоризації даних призначена для забезпечення безперервного онлайн-аналізу слабко структурованих даних, у тому числі у моменти різкого росту інформаційних повідомлень. Джерелами документів, що надходять у систему, є вже існуючі бази даних, файлові системи або такі, що їх знайдено в мережі за допомогою пошукових або інших систем, та вони існують у вигляді набора гіперпосилань на електронні ресурси. Процес категоризації неструктурованих даних полягає у класифікації кожного документу за одним або декількома класифікаторами, виділення його структурних частин-носіїв знань згідно заздалегідь визначеним правилам, визначення семантичних конструкцій, що містять емоційну забарвленість, вилучення потенційно позитивних та негативних фактів. Автори роботи Макуха Михайло Павлович Панкратова Наталія Дмитрівна Савастьянов Володимир Володимирович Савченко Ілля Олександрович Додано в НРАТ 2020-04-02 Закрити
НДДКР ОК
Керівник: Панкратова Наталія Дмитрівна. Розробка розподілених інформаційно-аналітичних систем для категоризації великих обсягів неструктурованих даних. (Етап: ). Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ". № 0216U001545
Знайдено документів: 1
Підписка
Повний текст наразі ще відсутній.
Повідомити вам про надходження повного тексту?
Повідомити вам про надходження повного тексту?
Оновлено: 2026-03-16
