1 documents found
Information × Registration Number 2125U003076, Article popup.category Бакалаврська робота Title "Live Subtitle Studio" (AI translated) popup.author Грицик Станіслав ВасильовичHrytsyk Stanislav Vasylovych popup.publication 01-01-2025 popup.source_user Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» popup.source https://ela.kpi.ua/handle/123456789/76181 popup.publisher Київ Description У роботі обґрунтовано необхідність створення десктопного застосунку «Live Subtitle Studio» для автоматичної транскрипції мовлення та генерації субтитрів як у реальному часі, так і для попередньо завантажених медіафайлів. Актуальність зумовлена зростанням обсягів відеоконтенту і потребою в його доступності для осіб із порушеннями слуху та користувачів в умовах шуму чи вивчення мов. Реалізовано проєктування архітектури, розробка алгоритмів і модулів у межах наукових тем кафедри «Інтелектуальні системи обробки мовлення». Застосунок створено з використанням PyQt5, FFmpeg, OpenAI Whisper і SQLite — реалізовано трирівневу архітектуру, багатопотокову обробку, локальну авторизацію, стабільність і логування. Наукова новизна полягає в інтеграції моделі Whisper у локальний GUI-додаток із підтримкою як live-транскрипції, так і пакетної обробки, що має практичне значення для освітніх і корпоративних систем. The paper substantiates the need to create a desktop application ‘Live Subtitle Studio’ for automatic speech transcription and subtitle generation both in real time and for pre-loaded media files. The relevance of the project is driven by the growing volume of video content and the need for its accessibility for people with hearing impairments and users in noise or language learning environments. The architecture design, algorithm development, and modules were implemented within the framework of the department's research topics on Intelligent Speech Processing Systems. The application was developed using PyQt5, FFmpeg, OpenAI Whisper, and SQLite, and features a three-tier architecture, multi-threaded processing, local authorisation, stability, and logging. The scientific novelty lies in the integration of the Whisper model into a local GUI application that supports both live transcription and batch processing, which is of practical importance for educational and corporate systems. popup.nrat_date 2025-11-05 Close
Article
Бакалаврська робота
Грицик Станіслав Васильович. "Live Subtitle Studio" (AI translated)
:
published. 2025-01-01;
Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2125U003076
1 documents found
search.subscribing
search.subscribe_text
Updated: 2026-03-25
