1 documents found
Information × Registration Number 2022U000132, Article popup.category Title The application of latent Dirichlet allocation for the analysis of latvian historical newspapers: Oskars Kalpaks’ case study popup.author Баклане АндаСаулеспуренс ВалдісBaklāne AndaSaulespurēns Valdis popup.publication 22-03-2022 popup.source_user Наука, технології, інновації №1(21) 2022 popup.source http://nti.ukrintei.ua/?page_id=4196&lang=en popup.publisher ДНУ «Український інститут науково-технічної експертизи та інформації» Description Упродовж останніх 20-ти років тематичне моделювання і, зокрема, застосування моделі LDA (прихованого розподілу Діріхле) стало одним із найчастіше використовуваних методів дослідницького аналізу та пошуку інформації з текстових джерел. Хоча тематичне моделювання використовувалося для досліджень у великій кількості проєктів, ця технологія ще не стала частиною загальних стандартних функцій цифрових історичних колекцій, що куруються бібліотеками, архівами та іншими установами пам’яті. Окрім того, чимало широко поширених і добре вивчених методів обробки природної мови, включаючи тематичне моделювання, недостатньо застосовувалися для роботи з джерелами нечисленних або малоресурсних мов, включаючи латиську. У статті представлені результати першого тематичного дослідження, у якому методологія LDA використовувалася для аналізу набору даних історичних газет латиською мовою. Для проведення аналізу використовується корпус газети «Латвійський солдат», на прикладі виконання тем, пов’язаних із першим командувачем Латвійської армії Оскаром Калпаксом. У дослідженнях цифрових гуманітарних наук результати тематичного моделювання використовувалися й інтерпретувалися декількома різними способами залежно від типу та жанру тексту, наприклад, для отримання семантичних зв’язних, які заслуговують на довіру для списків ключових слів або для отримання лексичних ознак, які не допомагають тематичному аналізу, але замість цього дають інші відомості про використання мови. Автори статті пропонують додатки, які могли б бути найбільш підходящими для аналізу історичних газет у великих цифрових колекціях установ пам’яті, а також розповідають про проблеми, пов’язані з роботою з текстовими джерелами, що містять помилки оптичного розпізнавання, проблематичну сегментацію статей та інших несучасних даних. popup.nrat_date 2023-03-31 Close
Article
Стаття
Баклане Анда. The application of latent Dirichlet allocation for the analysis of latvian historical newspapers: Oskars Kalpaks’ case study : published. 2022-03-22; Наука, технології, інновації №1(21) 2022, 2022U000132
1 documents found

Updated: 2026-03-27