Казахстан готов участвовать в создании тюркской языковой модели
Такая модель даст толчок развитию локального ИИ-бизнеса и стартапов
Казахстан выразил готовность принять активное участие в создании тюркской большой языковой модели (Large Language Model, LLM), объединяющей научный потенциал стран тюркского мира в сфере искусственного интеллекта. Об этом заявил заместитель премьер-министра – министр искусственного интеллекта и цифрового развития Жаслан Мадиев на встрече с министром цифрового развития и транспорта Азербайджана Рашадом Набиевым в Астане.
Тюркская языковая модель — это специализированный ИИ-алгоритм, обученный на текстах тюркских языков, способный понимать, генерировать и анализировать тексты с учетом культурных и лингвистических особенностей региона. Для Казахстана, где казахский язык является государственным, а другие тюркские языки и русский широко распространены, такая модель позволит:
- создавать более точные и релевантные сервисы на казахском и родственных языках, включая голосовые помощники, переводчики и образовательные платформы;
- ускорить цифровизацию государственных услуг с учетом национальной специфики.
- поддержать развитие локального ИИ-бизнеса и стартапов, повысить их конкурентоспособность на мировом рынке;
- сохранять и развивать культурное наследие через технологии, адаптированные к языковым особенностям региона.
Мадиев подчеркнул, что Казахстан уже имеет опыт создания собственных языковых моделей KazLLM и AlemLLM, включая модели на казахском языке, и располагает инфраструктурой для реализации масштабных ИИ-проектов — в частности, Национальным суперкомпьютерным центром Alem.Cloud, крупнейшим в Центральной Азии.
Большие языковые модели, такие как GPT-4 от OpenAI, PaLM от Google и LLaMA от Meta, уже трансформируют глобальные рынки, меняя подходы к обработке естественного языка (NLP), автоматизации и созданию контента. Однако большинство из них ориентированы на английский и другие широко распространенные языки, что создает вызовы для региональных языков и культур.
Исследования показывают, что локализация языковых моделей повышает их эффективность и приемлемость для пользователей. Например, проекты по созданию языковых моделей для африканских, индийских и арабских языков демонстрируют рост интереса к региональным ИИ-решениям.
Тюркские языки, объединяющие более 170 млн носителей, остаются недостаточно представленными в глобальных ИИ-проектах. Создание тюркской LLM позволит не только улучшить качество ИИ-сервисов для миллионов пользователей, но и укрепить цифровой суверенитет стран региона.
Казахстан и Азербайджан уже активно развивают сотрудничество в IT-сфере через Astana Hub и Silkroad Innovation Hub в США, поддерживают стартапы и реализуют совместные проекты в области ИИ и цифровых технологий. В рамках визита президента Азербайджана подписаны меморандумы о сотрудничестве в сфере искусственного интеллекта и государственных услуг.