Знайдено документів: 1
Інформація × Реєстраційний номер 2125U002970, Матеріали видань та локальних репозитаріїв Категорія Бакалаврська робота Назва роботи Аналіз впливу машинного перекладу на метрики анотування текстів Автор Думайло Тарас МихайловичDumailo Taras Mykhailovych Дата публікації 01-01-2025 Постачальник інформації Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» Першоджерело https://ela.kpi.ua/handle/123456789/75925 Видання Київ Опис Дипломна робота: 86 стор., 10 рис., 8 табл., 18 посилань, 2 додатки. У роботі досліджується вплив машинного перекладу на якість автоматичного анотування текстів за допомогою сучасних нейронних моделей. Основну увагу приділено оцінці змін у результатах сумаризації після перекладу текстів з англійської на українську мову та навпаки. Для аналізу використовуються різні метрики якості — ROUGE, BLEU, BERTScore та інші. Побудовано експериментальний пайплайн, що включає збір даних, автоматичне узагальнення текстів, машинний переклад, а також обчислення метрик та візуалізацію результатів. Об’єктом дослідження є процес автоматичного анотування текстів у контексті багатомовного середовища. Предметом дослідження виступає зміна метрик якості сумаризації в результаті застосування машинного перекладу. Актуальність роботи зумовлена широким використанням автоматичних систем обробки текстів у багатомовних інформаційних середовищах, де якість узагальнень може значно залежати від проміжного перекладу. Проаналізовано вплив типових систем машинного перекладу на результати сумаризації, зокрема на лексичні та семантичні відповідності між оригінальними й перекладеними текстами. Показано, як різні метрики реагують на перекладні зміни та які моделі виявляються найбільш стійкими до таких змін. Робота робить внесок у розуміння впливу мовної трансформації на автоматичну обробку текстів та відкриває перспективи для підвищення точності багатомовних NLP-систем. Thesis: 86 pages, 10 figures, 8 tables, 18 references, 2 appendices. This thesis explores the impact of machine translation on the quality of automatic text annotation using modern neural models. The main focus is on evaluating changes in summarization results after translation texts from English to Ukrainian and vice versa. Various quality metrics — ROUGE, BLEU, BERTScore, and others — are used for analysis. An experimental pipeline is developed, including data collection, automatic summarization, machine translation, metric computation, and result visualization. The object of the research is the process of automatic text annotation in a multilingual context. The subject of the research is variation in quality metrics summarization resulting from use of machine translation. The urgency of this research arises from the widespread application of automatic text processing systems in multilingual digital environments, where the quality of summaries can be significantly affected by intermediate translation. The impact of typical machine translation systems on summarization results, in particular on lexical and semantic correspondence between original and translated texts, is analyzed. How different metrics respond to translation-induced changes and which models are most resilient to such transformations is demonstrated in this thesis. This research contributes to a better understanding of the effects of language transformation on automatic text processing and introduces prospects for improving the accuracy of multilingual NLP systems. Додано в НРАТ 2025-11-05 Закрити
Матеріали
Бакалаврська робота
Думайло Тарас Михайлович. Аналіз впливу машинного перекладу на метрики анотування текстів
:
публікація 2025-01-01;
Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2125U002970
Знайдено документів: 1
Підписка
Повний текст наразі ще відсутній.
Повідомити вам про надходження повного тексту?
Повідомити вам про надходження повного тексту?
Оновлено: 2026-03-18
