1 documents found
Information × Registration Number 2121U007642, Article popup.category Бакалаврська робота Title Аналiз ефективностi методiв навчання з пiдкрiпленням на прикладi гри Nidhogg (AI translated) popup.author Гридін Олександр ВадимовичHrydin Oleksandr Vadymovych popup.publication 01-01-2021 popup.source_user Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» popup.source https://ela.kpi.ua/handle/123456789/42788 popup.publisher Київ Description Метою даної дипломної роботи було дослідити ефективність програми, що базується на навчанні з підкріпленням у грі “Nidhogg”. Ця гра містить елементи людської психології, де гравці повинні передбачити, що зробить їхній опонент, щоб досягти фінішної точки. Це піднімає питання: "чи може нейронна мережа навчити себе бути непередбачуваною?". Чи вдасться їй перехитрити опонента? Або вона просто використовуватиме найнадійнішу стратегію в будь-яких ситуаціях? Щоб перевірити це, агент був реалізований з використанням бібліотеки для навчання з підкріпленням “Serpent.AI” для мови Python. Ця бібліотека також має спосіб візуалізації процесу навчання. Агенту дозволили зіграти 10000 матчів та порівняли з агентом, який діє випадково. Результати показали, що навчальний агент мав більше успіхів у спробах досягти мети, ніж той, який робив випадкові дії. The goal of this thesis was to research the effectiveness of reinforcement learning based program in learning to play the game “Nidhogg”. This game contains the elements of human psychology, where players have to predict what move their opponent would do to reach the finishing point. This raises a question: “can a neural network train itself to be unpredictable?”. Will it succeed in the game of wits? Or will it just use the most reliable strategy at any situations? To test this, the agent was implemented using “Serpent.AI” reinforcement learning library for Python language. This library also has a way to visualize the learning process. Agent played 10000 sets of matches and was compared to another one that acts randomly. The results showed that the learning agent had more success in trying to reach the goal than the random one. popup.nrat_date 2025-11-05 Close
Article
Бакалаврська робота
Гридін Олександр Вадимович. Аналiз ефективностi методiв навчання з пiдкрiпленням на прикладi гри Nidhogg (AI translated) : published. 2021-01-01; Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2121U007642
1 documents found

Updated: 2026-03-22