УКРАЇНСЬКА LLM НА ОСНОВІ GEMMA ВІД GOOGLE

Міністерство цифрової трансформації України та Київстар повідомляють, що ними обрано велику мовну модель, на якій тренуватимуть національну українську LLM.

Нею стала загальнодоступна open-source-модель Gemma 3 від Google. Її планується адаптувати до української мови, удосконалити український токенайзер (це покращить роботу моделі з українською мовою, зменшить помилки при створенні україномовних текстів та оптимізує обчислювальні витрати при використанні моделі); донавчити модель на унікальних україномовних текстах, які зараз збирають експерти. Ключовими перевагами у виборі моделі стали наступні: оптимальний баланс продуктивності та ресурсів (Gemma забезпечує високу якість при оптимальних інфраструктурних вимогах, це одна з найкращих серед відкритих моделей з погляду співвідношення розміру та якості); багатомовна підтримка (модель наразі має українську мову у своєму діапазоні та легко адаптується через донавчання); мультимодальність (модель може сприймати й аналізувати не лише текст, а й зображення); розширений токенайзер (обсяг токенів забезпечує точне та ефективне опрацювання текстів та донавчання); довге контекстне вікно (128 тис. токенів); наявність кількох розмірностей (що дозволяє гнучко обирати розмір моделі під конкретну сферу застосування); успішні приклади використання для створення українськомовних LLM (Lapa LLM та MamayLM).

Детальніше: https://qrpage.net/qr/2Orbs, https://qrpage.net/qr/jOKXY

Фото: скріншот

#НРАТ_Усі_новини #НРАТ_ШтучнийІнтелект #НРАТ_Науковцям_новини #НРАТ_Освітянам_новини #НРАТ_Інноваторам_новини #НРАТ_Бібліотекарям

УКРАЇНСЬКА LLM НА ОСНОВІ GEMMA ВІД GOOGLE

2025-12-05

Зберегти в PDF

National Repository of Academic Texts

The NRAT database:

Reports in the field of scientific and scientific and technical activities

Dissertations for obtaining scientific degrees and abstracts

Materials from publications and local repositories

УКРАЇНСЬКА LLM НА ОСНОВІ GEMMA ВІД GOOGLE

Reports in the field of scientific and scientific and technical activities

Dissertations for obtaining scientific degrees and abstracts

Materials from publications and local repositories

Check out other news:

БІЛЬШЕ ВИКЛАДАЧІВ І МЕНШЕ ПЕРСПЕКТИВ: НОВІ ТЕНДЕНЦІЇ НА РИНКУ ПРАЦІ

КОНКУРС НА ЗДОБУТТЯ МІЖНАРОДНОЇ ПРЕМІЇ L’OREAL-UNESCO 2027

ОЕСР: ПІДВИЩЕННЯ ПОІНФОРМОВАНОСТІ ГРОМАДЯН ПРО ДЕРЖАВНІ ФІНАНСИ

ARXIV ПОСИЛЮЄ БОРОТЬБУ З ФАЛЬШИВИМИ ПОСИЛАННЯМИ

Check out other science events:

БІБЛІОТЕКА ТА ЧАТИ З ШІ

ROR: ІДЕНТИФІКАЦІЯ НАУКОВИХ ОРГАНІЗАЦІЙ

УНІВЕРСАЛЬНА ДЕСЯТКОВА КЛАСИФІКАЦІЯ: НОВІ ВИКЛИКИ

СЕРІЯ ВЕБІНАРІВ STRIKEPLAGIARISM