Інформація
Реєстраційний номер
0220U102891, 0117U002946 , Науково-дослідна робота
Назва роботи
Розробка алгоритмів та методів автоматизації процесів консолідації інформації з відкритих джерел
Назва етапу роботи
Керівник роботи
Кузьміних Валерій Олександровис,
Дата реєстрації
22-06-2020
Організація виконавець
Національний технічний університет України "Київський політехнічний інститут імені Ігоря Сікорського"
Опис етапу
Звіт містить 73 аркушів машинописного тексту, 22 рисунка 30 бібліографічних джерел. В роботі виконано: 1. Розглянуто задачу консолідації даних з відкритих джерел, з застосуванням спеціальних підходів та інструментів керування даними. Розроблено кількісні показники оцінки інформації у запитах. 2. Розглянуто 5 основних моделей пошуку інформації: булеву модель; модель нечітких множин; векторну модель; латентно-семантичну модель; ймовірнісні моделі, на основі яких створено систему базових елементів консолідації інформації і алгоритм кількісної оцінки інформації. 3. Розроблено програмний алгоритм, представлений у блок-схемі, формування релевантних документів у інформаційних джерелах для тестування алгоритмів консолідації. Наведено приклад згенерованого тестового середовища з 5-и інформаційних джерел. 4. Досліджено ефективність системи консолідації інформації з відкритих джерел на основі стохастичного автомату, що дозволяє констатувати підвищення ефективності в 3–и рази і більше. 5. Досліджено використання засобів парсингу при консолідації інформації з відкритих джерел. Виявлено і обґрунтовано, що найбільш відповідним та ефективним може бути використання засобів парсингу зі зберіганням ієрархії елементів. 6. Розглянуто застосування штучного інтелекту, у консолідації інформації, на основі триграм аналізу текстової інформації. 7. Розроблено систему пошуку патентної інформації. 8. Розроблено систему консолідації інформації при геокодуванні інформаційних запитів. Розроблено схему системи, розглянуто компоненти пошуку інформації, компоненти аналізу. 9. Розглянуто особливості пошуку інформації в INDUSTRY 4.0. Розглянуто метрики Хеммінга, Левенштейна і Дамерау Левенштейна. Запропоновано алгоритм системи консолідації інформації в INDUSTRY 4.0. Ключові слова: КОНСОЛІДАЦІЯ ІНФОРМАЦІЇ З ВІДКРИТИХ ДЖЕРЕЛ; ШТУЧНИЙ ІНТЕЛЕКТ; СТОХАСТИЧНИЙ АВТОМАТ; ПАРСИНГ; ГЕОКОДУВАННЯ; INDUSTRY 4.0.
Опис продукції
На даний момент в Україні існує декілька баз патентів, які дозволяють здійснювати пошук патентів. Але в них є значні недоліки, такі як: не зручний інтерфейс, повільний час обробки запиту, обмеженні можливості сортування пошукової видачі. Розроблено систему програмних засобів для пошуку, аналізу та збереження для наступної обробки впорядженої консолідованої інформації у сфері патентної інформації. Така система має дати аналітику чітку інформацію про тематику заявки відповідно до цілей пошуку (пошуку плагіату, пошуку патентів на винаходи в суміжних областях, перевірки на предмет існування подібної заявки, визначення особливостей нового продукту, визначення інших сфер застосування нового продукту, пошуку винахідників або компаній, які отримали патенти на винаходи в тій же галузі, отримання інформації про приватних осіб, які мають патенти на схожі винаходи і т.ін.). Основними перевагами програмної системи засобів збору та обробки патентної інформації є: – можливість сортування пошукової видачі за всіма можливими параметрами; – можливість пошуку за синонімами ключових слів; – можливість повторного пошуку за ключовими словами; – накопичення інформації за результантами пошуку; – впорядження запиту по мірі релевантності за кількісною оцінкою результатів. Задачі, що вирішуються за допомогою даної системи: - аналіз існуючих систем пошуку патентної інформації; - підключення до існуючої патентної бази з метою отримання первинної патентної інформації; - вилучення патентної інформації за запитом; - аналіз вилученої інформації відповідно до запиту; - надання впорядженої інформації по запиту в зручному вигляді з можливістю аналізу конкретного патенту. Описана програмна система відрізняється від своїх аналогів тим, що крім виконання основного пошукового запиту, ведеться також пошук за синонімами ключових слів, вказаних в пошуковому запиті.
Автори роботи
Кузьміних Валерій Олександрович
Тараненко Руслан Анатолійович
Додано в НРАТ
2020-07-03
Підписка
Повідомити вам про надходження повного тексту?
Оновлено: 2025-12-07
