Знайдено документів: 1
Інформація × Реєстраційний номер 0211U004753, 0109U001786 , Науково-дослідна робота Назва роботи Створення збалансованого текстового банку даних української мови Назва етапу роботи Керівник роботи Ровенчак Андрій Адамович, Дата реєстрації 17-02-2011 Організація виконавець Львівський національний університет імені Івана Франка Опис етапу Запропоновано розширення набору теґів стандарту QuanTA. У зібраних текстах, відформатованих згідно з прийнятим стандартом QuanTA, виконано анотацію основних та другорядних зовнішніх елементів тексту (підписи, підзаголовки тощо), скорочень, числових позначень та ін. Встановлено набір параметрів для автоматичної жанрової атрибуції текстів. Підтверджено виконання статистичних законів, зокрема закону Менцерата-Альманна. Запропоновано нові параметри для опису частотної структури тексту на підставі аналогії з фізичною моделлю - розподілом Бозе. Опис продукції Запропоновано розширення набору теґів стандарту QuanTA. У зібраних текстах, відформатованих згідно з прийнятим стандартом QuanTA, виконано анотацію основних та другорядних зовнішніх елементів тексту (підписи, підзаголовки тощо), скорочень, числових позначень та ін. Встановлено набір параметрів для автоматичної жанрової атрибуції текстів. Підтверджено виконання статистичних законів, зокрема закону Менцерата-Альманна. Запропоновано нові параметри для опису частотної структури тексту на підставі аналогії з фізичною моделлю - розподілом Бозе Автори роботи Бук Соломія Несторівна Ровенчак Андрій Адамович Додано в НРАТ 2020-04-02 Закрити
НДДКР ОК
1
Керівник: Ровенчак Андрій Адамович. Створення збалансованого текстового банку даних української мови. (Етап: ). Львівський національний університет імені Івана Франка. № 0211U004753
Знайдено документів: 1

Оновлено: 2026-03-16