Новый проект обещает стимулировать ИИ-исследования и повысить технологическую независимость страны, сообщает inbusiness.kz.

Когда появится первая ИИ-версия большой языковой модели на казахском языке

Фото: pixabay.com

В рамках стратегического плана по развитию искусственного интеллекта в Казахстане Назарбаев Университет совместно с АО "Национальные информационные технологии" разрабатывают казахскую языковую модель KazLLM.

Проект, предполагающий создание модели на базе 100 млрд токенов, должен стать одним из ключевых шагов на пути к усилению научных исследований в области ИИ и повышению цифровой автономии страны.

По словам Гиззата Байтурсынова, председателя комитета искусственного интеллекта и развития инноваций, модель будет интегрирована с различными государственными и коммерческими системами для улучшения обработки и анализа казахского языка. Ожидается, что первая версия KazLLM будет представлена в декабре нынешнего года.

Проект также включает в себя национальный сбор данных через платформу Hugging Face, где уже собрано 30 млрд токенов из открытых источников и 90 терабайт данных из государственных архивов и СМИ. Эти меры направлены на обеспечение высокого качества и представительности будущей модели.

Байтурсынов подчеркнул, что к 2029 году Казахстан планирует довести количество патентов в области ИИ до не менее 20 в год, что станет свидетельством роста внутренних научных и технологических компетенций. Создание KazLLM не только способствует научным исследованиям, но и создает предпосылки для развития местной экосистемы ИИ, включая акселерационные программы для поддержки предпринимательской активности в сфере информационных технологий.

Автор Руслан Логинов

Источник inbusiness.kz