Знайдено документів: 1
Інформація × Реєстраційний номер 2121U007642, Матеріали видань та локальних репозитаріїв Категорія Бакалаврська робота Назва роботи Аналiз ефективностi методiв навчання з пiдкрiпленням на прикладi гри Nidhogg Автор Гридін Олександр ВадимовичHrydin Oleksandr Vadymovych Дата публікації 01-01-2021 Постачальник інформації Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» Першоджерело https://ela.kpi.ua/handle/123456789/42788 Видання Київ Опис Метою даної дипломної роботи було дослідити ефективність програми, що базується на навчанні з підкріпленням у грі “Nidhogg”. Ця гра містить елементи людської психології, де гравці повинні передбачити, що зробить їхній опонент, щоб досягти фінішної точки. Це піднімає питання: "чи може нейронна мережа навчити себе бути непередбачуваною?". Чи вдасться їй перехитрити опонента? Або вона просто використовуватиме найнадійнішу стратегію в будь-яких ситуаціях? Щоб перевірити це, агент був реалізований з використанням бібліотеки для навчання з підкріпленням “Serpent.AI” для мови Python. Ця бібліотека також має спосіб візуалізації процесу навчання. Агенту дозволили зіграти 10000 матчів та порівняли з агентом, який діє випадково. Результати показали, що навчальний агент мав більше успіхів у спробах досягти мети, ніж той, який робив випадкові дії. The goal of this thesis was to research the effectiveness of reinforcement learning based program in learning to play the game “Nidhogg”. This game contains the elements of human psychology, where players have to predict what move their opponent would do to reach the finishing point. This raises a question: “can a neural network train itself to be unpredictable?”. Will it succeed in the game of wits? Or will it just use the most reliable strategy at any situations? To test this, the agent was implemented using “Serpent.AI” reinforcement learning library for Python language. This library also has a way to visualize the learning process. Agent played 10000 sets of matches and was compared to another one that acts randomly. The results showed that the learning agent had more success in trying to reach the goal than the random one. Додано в НРАТ 2025-11-05 Закрити
Матеріали
Бакалаврська робота
Гридін Олександр Вадимович. Аналiз ефективностi методiв навчання з пiдкрiпленням на прикладi гри Nidhogg : публікація 2021-01-01; Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2121U007642
Знайдено документів: 1

Оновлено: 2026-03-14