Знайдено документів: 1
Інформація × Реєстраційний номер 2022U000132, Матеріали видань та локальних репозитаріїв Категорія Назва роботи ЗАСТОСУВАННЯ ЛАТЕНТНОГО РОЗПОДІЛУ ДІРІХЛЕ ДЛЯ АНАЛІЗУ ЛАТВІЙСЬКИХ ІСТОРИЧНИХ ГАЗЕТ: ПРИКЛАД ОСКАРА КАЛПАКА Автор Баклане АндаСаулеспуренс ВалдісBaklāne AndaSaulespurēns Valdis Дата публікації 22-03-2022 Постачальник інформації Наука, технології, інновації №1(21) 2022 Першоджерело http://nti.ukrintei.ua/?page_id=4196&lang=en Видання ДНУ «Український інститут науково-технічної експертизи та інформації» Опис Упродовж останніх 20-ти років тематичне моделювання і, зокрема, застосування моделі LDA (прихованого розподілу Діріхле) стало одним із найчастіше використовуваних методів дослідницького аналізу та пошуку інформації з текстових джерел. Хоча тематичне моделювання використовувалося для досліджень у великій кількості проєктів, ця технологія ще не стала частиною загальних стандартних функцій цифрових історичних колекцій, що куруються бібліотеками, архівами та іншими установами пам’яті. Окрім того, чимало широко поширених і добре вивчених методів обробки природної мови, включаючи тематичне моделювання, недостатньо застосовувалися для роботи з джерелами нечисленних або малоресурсних мов, включаючи латиську. У статті представлені результати першого тематичного дослідження, у якому методологія LDA використовувалася для аналізу набору даних історичних газет латиською мовою. Для проведення аналізу використовується корпус газети «Латвійський солдат», на прикладі виконання тем, пов’язаних із першим командувачем Латвійської армії Оскаром Калпаксом. У дослідженнях цифрових гуманітарних наук результати тематичного моделювання використовувалися й інтерпретувалися декількома різними способами залежно від типу та жанру тексту, наприклад, для отримання семантичних зв’язних, які заслуговують на довіру для списків ключових слів або для отримання лексичних ознак, які не допомагають тематичному аналізу, але замість цього дають інші відомості про використання мови. Автори статті пропонують додатки, які могли б бути найбільш підходящими для аналізу історичних газет у великих цифрових колекціях установ пам’яті, а також розповідають про проблеми, пов’язані з роботою з текстовими джерелами, що містять помилки оптичного розпізнавання, проблематичну сегментацію статей та інших несучасних даних. Додано в НРАТ 2023-03-31 Закрити
Матеріали
Стаття
Баклане Анда. ЗАСТОСУВАННЯ ЛАТЕНТНОГО РОЗПОДІЛУ ДІРІХЛЕ ДЛЯ АНАЛІЗУ ЛАТВІЙСЬКИХ ІСТОРИЧНИХ ГАЗЕТ: ПРИКЛАД ОСКАРА КАЛПАКА : публікація 2022-03-22; Наука, технології, інновації №1(21) 2022, 2022U000132
Знайдено документів: 1

Оновлено: 2026-03-20