1 documents found
Information × Registration Number 0524U000108, Doctoral dissertation Status Доктор технічних наук Date 10-05-2024 popup.evolution o Title Methodological foundations of information technology for gene expression data processing and its application in the field of bioinformatics Author Ihor M. Liakh, Кандидат технічних наук popup.opponent Volodymyr Lytvynenko popup.opponent Maksym Korobchinsky popup.opponent Rostyslav L. Tkachuk popup.review Bohdan Kovalskyi popup.review Vsevolod M. Senkivskyi popup.review Oleksandr V. Tymchenko Description У дисертаційній роботі запропоновано рішення актуальної науково-практичної проблеми: розробка методологічних основ інформаційної технології обробки даних експресії генів для розв’язання задач в галузі біоінформатики на основі комплексного застосування аналізу генної онтології, кластер-бікластерного аналізу та методів глибинного навчання, відмінною рисою якої є більш висока у порівнянні з існуючими методами адекватність оцінки стану об’єкта за рахунок гібридизації існуючих методів та алгоритмів обробки великих даних, оптимізації значень гіперпараметрів моделі із застосуванням кількісних критеріїв якості при реалізації відповідного етапу враховуючи тип даних, що досліджуються. У роботі уперше представлено розробку інформаційної технології, спеціалізованої для обробки даних експресії генів, яка використовує інтегрований підхід, що об'єднує аналіз генної онтології, кластер-бікластерний аналіз та сучасні методи глибинного навчання. Цей комплексний метод спрямований на підвищення точності та надійності в діагностиці станів складних об’єктів. Значущість цієї технології полягає у її здатності до глибокого аналізу та точної класифікації даних, що відкриває нові перспективи для досліджень при створенні систем діагностики складних об’єктів. Для підтримки цих вимог, уперше розроблено гібридну модель, яка дозволяє ефективно формувати підмножини значущих генів, використовуючи кластер-бікластерний аналіз та аналіз генної онтології. Здійснено детальний порівняльний аналіз різних типів та архітектур глибинних нейронних мереж, включаючи як згорткові, так і рекурентні нейронні мережі, а також їх гібридні комбінації. Особливу увагу приділено визначенню оптимальних гіперпараметрів за допомогою алгоритму оптимізації Байєса. Досліджено гібридну модель класифікації, що інтегрує методи глибинного та машинного навчання, для покращення об'єктивності в ідентифікації зразків. Модель складається з двох ієрархічних рівнів, де на першому рівні застосовуються різні моделі глибинного навчання для формування проміжних рішень, які у подальшому обробляються класифікатором на другому рівні. В якості класифікатора використовується алгоритм на основі дерева рішень (CART), що дозволяє формувати остаточні висновки щодо ідентифікації об'єкта. У дисертації також уперше розроблено гібридну модель бікластеризації, що використовує алгоритм ensemble для бікластеризації та метод оптимізації Байєса для точного налаштування параметрів алгоритму, забезпечуючи високу якість бікластеризації на основі оцінки взаємної інформації між рядками та стовпчиками бікластерів. Крім того, уперше запропоновано гібридну модель діагностики об’єктів на основі даних експресії генів, яка комбінує аналіз генної онтології, кластер-бікластерний аналіз та згорткові нейронні мережі, яка продемонструвала високу точність ідентифікації стану об'єктів з меншою кількістю значущих генів, що відкриває нові можливості для налаштування діагностичних моделей у біомедичних дослідженнях. Запропонований інтегральний критерій F1-міри, розрахунок якого передбачає застосування методу бажаностей Харрінгтона до парціальних значень F1-міри, що розраховані для окремих класів; методи застосування рекурентної нейронної мережі (РНМ) для обробки даних експресії генів. Досліджено два типи РНМ: LSTM та GRU. Запропоновано алгоритм оптимізації архітектури та значень гіперпараметрів РНМ, здійснено порівняльний аналіз методів оптимізації на основі упорядкованого пошуку за сіткою та алгоритму байєсівської оптимізації. Запропоновано комплексний критерій якості класифікації даних із застосуванням відповідного типу мережі глибинного навчання, що розраховується як зважена сума парціальних критеріїв якості, що розраховувалися в процесі моделювання. Виконано моделювання різних архітектур РНМ, за результатами якого визначенні оптимальні значення гіперпараметрів для кожного типу мережі; методи бікластеризації даних експресії генів шляхом більш ретельного формування критеріїв якості бікластеризації, які визначають бікластерну структуру, що створюється в процесі реалізації відповідного алгоритму бікластеризації. Запропоновано внутрішній критерій якості бікластеризації на основі оцінки взаємної інформації як між рядками бікластера, так і між його стовпцями. Ключові слова: дані експресії генів, взаємна інформація, ентропія Шеннона, бікластеризація, метод оптимізації Байєса, алгоритми кластеризації, аналіз генної онтології, глибинне навчання, гібридні моделі, мультикритеріальна оптимізація, згорткова нейронна мережа, рекурентна нейронна мережа. Registration Date 2024-04-08 popup.nrat_date 2024-04-08 Close
Doctoral dissertation
Ihor M. Liakh. Methodological foundations of information technology for gene expression data processing and its application in the field of bioinformatics
: Доктор технічних наук :
spec.. 05.13.06 - Інформаційні технології :
presented. 2024-05-10; popup.evolution: o;
Ukrainian Academy of Printing. – Львів, 0524U000108.
1 documents found
search.subscribing
search.subscribe_text
Updated: 2026-03-20
