Знайдено документів: 1
Інформація × Реєстраційний номер 0524U000108, Докторська дисертація На здобуття Доктор технічних наук Дата захисту 10-05-2024 Статус Запланована Назва роботи Методологічні основи інформаційної технології обробки даних експресії генів та її застосування в галузі біоінформатики Здобувач Лях Ігор Михайлович, Кандидат технічних наук Опонент Литвиненко Володимир Іванович Опонент Коробчинський Максим Володимирович Опонент Ткачук Ростислав Львович Рецензент Ковальський Богдан Михайлович Рецензент Сеньківський Всеволод Миколаєвич Рецензент Тимченко Олександр Володимирович Опис У дисертаційній роботі запропоновано рішення актуальної науково-практичної проблеми: розробка методологічних основ інформаційної технології обробки даних експресії генів для розв’язання задач в галузі біоінформатики на основі комплексного застосування аналізу генної онтології, кластер-бікластерного аналізу та методів глибинного навчання, відмінною рисою якої є більш висока у порівнянні з існуючими методами адекватність оцінки стану об’єкта за рахунок гібридизації існуючих методів та алгоритмів обробки великих даних, оптимізації значень гіперпараметрів моделі із застосуванням кількісних критеріїв якості при реалізації відповідного етапу враховуючи тип даних, що досліджуються. У роботі уперше представлено розробку інформаційної технології, спеціалізованої для обробки даних експресії генів, яка використовує інтегрований підхід, що об'єднує аналіз генної онтології, кластер-бікластерний аналіз та сучасні методи глибинного навчання. Цей комплексний метод спрямований на підвищення точності та надійності в діагностиці станів складних об’єктів. Значущість цієї технології полягає у її здатності до глибокого аналізу та точної класифікації даних, що відкриває нові перспективи для досліджень при створенні систем діагностики складних об’єктів. Для підтримки цих вимог, уперше розроблено гібридну модель, яка дозволяє ефективно формувати підмножини значущих генів, використовуючи кластер-бікластерний аналіз та аналіз генної онтології. Здійснено детальний порівняльний аналіз різних типів та архітектур глибинних нейронних мереж, включаючи як згорткові, так і рекурентні нейронні мережі, а також їх гібридні комбінації. Особливу увагу приділено визначенню оптимальних гіперпараметрів за допомогою алгоритму оптимізації Байєса. Досліджено гібридну модель класифікації, що інтегрує методи глибинного та машинного навчання, для покращення об'єктивності в ідентифікації зразків. Модель складається з двох ієрархічних рівнів, де на першому рівні застосовуються різні моделі глибинного навчання для формування проміжних рішень, які у подальшому обробляються класифікатором на другому рівні. В якості класифікатора використовується алгоритм на основі дерева рішень (CART), що дозволяє формувати остаточні висновки щодо ідентифікації об'єкта. У дисертації також уперше розроблено гібридну модель бікластеризації, що використовує алгоритм ensemble для бікластеризації та метод оптимізації Байєса для точного налаштування параметрів алгоритму, забезпечуючи високу якість бікластеризації на основі оцінки взаємної інформації між рядками та стовпчиками бікластерів. Крім того, уперше запропоновано гібридну модель діагностики об’єктів на основі даних експресії генів, яка комбінує аналіз генної онтології, кластер-бікластерний аналіз та згорткові нейронні мережі, яка продемонструвала високу точність ідентифікації стану об'єктів з меншою кількістю значущих генів, що відкриває нові можливості для налаштування діагностичних моделей у біомедичних дослідженнях. Запропонований інтегральний критерій F1-міри, розрахунок якого передбачає застосування методу бажаностей Харрінгтона до парціальних значень F1-міри, що розраховані для окремих класів; методи застосування рекурентної нейронної мережі (РНМ) для обробки даних експресії генів. Досліджено два типи РНМ: LSTM та GRU. Запропоновано алгоритм оптимізації архітектури та значень гіперпараметрів РНМ, здійснено порівняльний аналіз методів оптимізації на основі упорядкованого пошуку за сіткою та алгоритму байєсівської оптимізації. Запропоновано комплексний критерій якості класифікації даних із застосуванням відповідного типу мережі глибинного навчання, що розраховується як зважена сума парціальних критеріїв якості, що розраховувалися в процесі моделювання. Виконано моделювання різних архітектур РНМ, за результатами якого визначенні оптимальні значення гіперпараметрів для кожного типу мережі; методи бікластеризації даних експресії генів шляхом більш ретельного формування критеріїв якості бікластеризації, які визначають бікластерну структуру, що створюється в процесі реалізації відповідного алгоритму бікластеризації. Запропоновано внутрішній критерій якості бікластеризації на основі оцінки взаємної інформації як між рядками бікластера, так і між його стовпцями. Ключові слова: дані експресії генів, взаємна інформація, ентропія Шеннона, бікластеризація, метод оптимізації Байєса, алгоритми кластеризації, аналіз генної онтології, глибинне навчання, гібридні моделі, мультикритеріальна оптимізація, згорткова нейронна мережа, рекурентна нейронна мережа. Дата реєстрації 2024-04-08 Додано в НРАТ 2024-04-08 Закрити
Дисертація докторська
3
Лях Ігор Михайлович. Методологічні основи інформаційної технології обробки даних експресії генів та її застосування в галузі біоінформатики : Доктор технічних наук : спец.. 05.13.06 - Інформаційні технології : дата захисту 2024-05-10; Статус: Запланована; Українська академія друкарства. – Львів, 0524U000108.
Знайдено документів: 1

Оновлено: 2026-03-20