ОТГ

Казахстан готов участвовать в создании тюркской языковой модели

Такая модель даст толчок развитию локального ИИ-бизнеса и стартапов

Министр ИИ Казахстан Жаслан Мадиев и министр ИИ Азербайджан Рашад Набиев
Министр ИИ Казахстан Жаслан Мадиев и министр ИИ Азербайджан Рашад Набиев Фото @МИИЦР РК

Казахстан выразил готовность принять активное участие в создании тюркской большой языковой модели (Large Language Model, LLM), объединяющей научный потенциал стран тюркского мира в сфере искусственного интеллекта. Об этом заявил заместитель премьер-министра – министр искусственного интеллекта и цифрового развития Жаслан Мадиев на встрече с министром цифрового развития и транспорта Азербайджана Рашадом Набиевым в Астане.

Тюркская языковая модель — это специализированный ИИ-алгоритм, обученный на текстах тюркских языков, способный понимать, генерировать и анализировать тексты с учетом культурных и лингвистических особенностей региона. Для Казахстана, где казахский язык является государственным, а другие тюркские языки и русский широко распространены, такая модель позволит:

  • создавать более точные и релевантные сервисы на казахском и родственных языках, включая голосовые помощники, переводчики и образовательные платформы;
  • ускорить цифровизацию государственных услуг с учетом национальной специфики.
  • поддержать развитие локального ИИ-бизнеса и стартапов, повысить их конкурентоспособность на мировом рынке;
  • сохранять и развивать культурное наследие через технологии, адаптированные к языковым особенностям региона.

Мадиев подчеркнул, что Казахстан уже имеет опыт создания собственных языковых моделей KazLLM и AlemLLM, включая модели на казахском языке, и располагает инфраструктурой для реализации масштабных ИИ-проектов — в частности, Национальным суперкомпьютерным центром Alem.Cloud, крупнейшим в Центральной Азии.

Большие языковые модели, такие как GPT-4 от OpenAI, PaLM от Google и LLaMA от Meta, уже трансформируют глобальные рынки, меняя подходы к обработке естественного языка (NLP), автоматизации и созданию контента. Однако большинство из них ориентированы на английский и другие широко распространенные языки, что создает вызовы для региональных языков и культур.

Исследования показывают, что локализация языковых моделей повышает их эффективность и приемлемость для пользователей. Например, проекты по созданию языковых моделей для африканских, индийских и арабских языков демонстрируют рост интереса к региональным ИИ-решениям. 

Тюркские языки, объединяющие более 170 млн носителей, остаются недостаточно представленными в глобальных ИИ-проектах. Создание тюркской LLM позволит не только улучшить качество ИИ-сервисов для миллионов пользователей, но и укрепить цифровой суверенитет стран региона.

Казахстан и Азербайджан уже активно развивают сотрудничество в IT-сфере через Astana Hub и Silkroad Innovation Hub в США, поддерживают стартапы и реализуют совместные проекты в области ИИ и цифровых технологий. В рамках визита президента Азербайджана подписаны меморандумы о сотрудничестве в сфере искусственного интеллекта и государственных услуг.