Знайдено документів: 1
Інформація × Реєстраційний номер 2125U002783, Матеріали видань та локальних репозитаріїв Категорія Бакалаврська робота Назва роботи Інтелектуальна система географічної локалізації на основі мультимодального аналізу зображень з Google Street View із застосуванням великих мовних моделей Автор Савчук Володимир ЮрійовичSavchuk Volodymyr Yuriiovych Дата публікації 01-01-2025 Постачальник інформації Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» Першоджерело https://ela.kpi.ua/handle/123456789/75827 Видання Київ Опис Дипломна робота: 137 с., 49 рис., 15 табл., 63 посилання, 1 додаток. Об’єктом дослідження є задача географічної локалізації на основі аналізу візуальних даних. Предметом дослідження є методи та алгоритми локалізації географічного місцезнаходження шляхом мультимодального аналізу зображень із використанням великих мовних моделей. Метою роботи є розробка інтелектуальної системи для прогнозування географічних координат на основі аналізу зображень Google Street View із врахуванням набору візуальних індикаторів географічного положення. У роботі проведено аналіз предметної області та існуючих рішень для визначення географічного розташування на основі аналізу візуальних даних. Результатом роботи є розроблена інтелектуальна система, що використовує провідні великі мовні моделі для аналізу візуального та лінгвістичного контексту зображень з Google Street View та прогнозування географічних координат місця зйомки. Аналіз якості прогнозів проведено шляхом інтеграції розробленої системи з онлайн-ресурсом GeoGuessr. За результатами роботи сформовано базу знань, яка може бути використана для навчання вузькоспеціалізованої моделі методом дистиляції знань. Матеріали проведеного дослідження представлено на XXIII Всеукраїнській науково-практичній конференції студентів, аспірантів та молодих вчених «Теоретичні і прикладні проблеми фізики, математики та інформатики» (14 – 17 травня 2025 р., Київ, Україна) та опубліковано у збірнику матеріалів конференції. Bachelor's thesis: 137 p., 49 figures, 15 tables, 63 references, appendix. The object of the study is a problem of geographic localization based on visual data analysis. The subject of research is the application of methods and algorithms for determining geographic location based on multimodal image analysis using large language models. The purpose of the work is to develop an intelligent system for predicting geographical coordinates through the analysis of Google Street View images, complemented by a set of visual indicators of geographical location. The paper undertakes a thorough examination of the subject area and the extant solutions for determining geographic location based on visual data analysis. As a result of this research, an intelligent system has been developed that analyzes visual and linguistic context of Google Street View images using leading large language models and predicts geographic coordinates of the location where the image was taken. The quality of the predictions was evaluated and analyzed through the integration of the developed system with the online resource GeoGuessr. As a result of the work, a structured knowledge database was formed. It can be used to train a highly specialized model by means of knowledge distillation. The research materials were presented at the XXIII All-Ukrainian Scientific and Practical Conference of Students, Postgraduates and Young Scientists «Theoretical and Applied Problems of Physics, Mathematics and Informatics» (May 14-17, 2025, Kyiv, Ukraine) and published in the conference proceedings. Додано в НРАТ 2025-11-05 Закрити
Матеріали
Бакалаврська робота
Савчук Володимир Юрійович. Інтелектуальна система географічної локалізації на основі мультимодального аналізу зображень з Google Street View із застосуванням великих мовних моделей : публікація 2025-01-01; Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2125U002783
Знайдено документів: 1

Оновлено: 2026-03-18