Sorry, this entry is only available in Українська.

Міністерство цифрової трансформації України та Київстар повідомляють, що ними обрано велику мовну модель, на якій тренуватимуть національну українську LLM.

Нею стала загальнодоступна open-source-модель Gemma 3 від Google. Її планується адаптувати до української мови, удосконалити український токенайзер (це покращить роботу моделі з українською мовою, зменшить помилки при створенні україномовних текстів та оптимізує обчислювальні витрати при використанні моделі); донавчити модель на унікальних україномовних текстах, які зараз збирають експерти. Ключовими перевагами у виборі моделі стали наступні: оптимальний баланс продуктивності та ресурсів (Gemma забезпечує високу якість при оптимальних інфраструктурних вимогах, це одна з найкращих серед відкритих моделей з погляду співвідношення розміру та якості); багатомовна підтримка (модель наразі має українську мову у своєму діапазоні та легко адаптується через донавчання); мультимодальність (модель може сприймати й аналізувати не лише текст, а й зображення); розширений токенайзер (обсяг токенів забезпечує точне та ефективне опрацювання текстів та донавчання); довге контекстне вікно (128 тис. токенів); наявність кількох розмірностей (що дозволяє гнучко обирати розмір моделі під конкретну сферу застосування); успішні приклади використання для створення українськомовних LLM (Lapa LLM та MamayLM). 

Детальніше: https://qrpage.net/qr/2Orbs, https://qrpage.net/qr/jOKXY 

Фото: скріншот

#НРАТ_Усі_новини #НРАТ_ШтучнийІнтелект #НРАТ_Науковцям_новини #НРАТ_Освітянам_новини #НРАТ_Інноваторам_новини #НРАТ_Бібліотекарям

УКРАЇНСЬКА LLM  НА ОСНОВІ GEMMA ВІД GOOGLE
2025-12-05
Share