Украина начинает разработку национальной большой языковой модели ИИ
Украина начинает разработку национальной большой языковой модели ИИ

Украина начинает разработку национальной большой языковой модели ИИ

WINWIN AI Center of Excellence при Минцифры и Киевстар — оператор электронных коммуникаций Украины — начинают разработку национальной большой языковой модели (LLM).

Модель будут использовать в цифровых государственных и бизнес-продуктах с искусственным интеллектом, чтобы сделать сервисы удобнее для людей и помочь организациям работать эффективнее, сообщили в Министерстве цифровой трансформации.

Большая языковая модель — это нейросеть, которая работает по принципу человеческого мозга и способна анализировать и генерировать тексты. Модели используют как базу для работы чатботов, AI-ассистентов и т.д.

На основе языковой модели государство будет создавать ИИ-продукты — для удобства граждан и улучшения внутренних процессов. Так, Минцифры планирует запустить AI-ассистента в Дие, инструменты для анализа законодательства, а также сервисы в Мрие для формирования индивидуальных образовательных траекторий для школьников. Всего в работе WINWIN AI Center of Excellence при Минцифры, который занимается разработкой AI-решений для министерства, более 10 продуктов.

Украинская LLM будет давать более точные ответы, чем глобальные модели, поскольку будет дополнительно натренирована (pre-trained) на украинских данных. Она лучше будет понимать языковые особенности — диалекты, термины, контекст — и хорошо ориентироваться в темах, связанных с украинской историей, культурой и общественным опытом. Так, модель будет отвечать правильно не только языково, но и по содержанию.

Национальная LLM позволяет сохранять и обрабатывать данные внутри страны, что критически важно для безопасности в сфере обороны, государственных учреждений, медицины и финансов. Модель обеспечит защиту персональных данных и национальной безопасности Украины при интеграции AI в различные секторы.

"Создание украинской LLM — важный шаг к лидерству Украины в сфере ИИ. Мы как государство сможем создавать удобные AI-сервисы для граждан и сделаем искусственный интеллект помощником правительства. При этом этот ИИ будет качественным и безопасным для граждан. Так, AI станет частью обороны, образования, науки и других стратегических сфер. С другой стороны, национальная LLM позволит бизнесу создавать инновационные продукты — более дешевые, безопасные и адаптированные к украинскому контексту. Для реализации этого амбициозного проекта мы объединяем усилия Минцифры с Киевстаром. Это пример эффективного партнерства, когда ведущий бизнес присоединяется к созданию решений национального масштаба", — отметил Михаил Федоров, Вице-премьер-министр по инновациям, развитию образования, науки и технологий — Министр цифровой трансформации.

Минцифры будет координировать процесс разработки модели и формировать технологическое и этическое видение создания LLM. В частности, создаст все ключевые структуры для качественной разработки модели — координационный комитет и этический и технический борды.

Координационный комитет будет отвечать за видение и стратегию разработки. В него войдут представители Минцифры, WINWIN AI Center of Excellence, других профильных государственных институций, Киевстара, технического и этического бордов. Этический борд будет отслеживать соответствие законодательству и этичность модели. Технический борд будет отвечать за архитектуру, тренировку модели на данных и т.д. Разработкой модели будет заниматься проектный офис, сформированный компанией Киевстар как операционным исполнителем разработки модели.

Минцифры будет обеспечивать сбор данных для обучения модели, для чего будет привлекать государственные и частные институции — университеты, научные структуры, национальные библиотеки и интеллектуальные фонды. К обучению будут привлекать данные из открытых источников на украинском языке, собранные в датасетах. Персональные данные, данные из реестров и любую другую чувствительную информацию для pre-training использовать не будут.

Стратегическим партнером государства в создании национальной LLM стал Киевстар — национальный оператор электронных коммуникаций. Компания активно инвестирует в новые технологии и цифровые сервисы, имеет глубокую экспертизу в сфере ИИ и интегрирует AI-решения в долгосрочную стратегию технологической трансформации. Киевстар сочетает языковые модели и современные RAG-системы (Retrieval Augmented Generation) с реальными бизнес-процессами, сервисной поддержкой и анализом данных, соблюдая высокие стандарты безопасности и этики.

Киевстар имеет прямой доступ к международному опыту через материнскую компанию VEON, которая уже реализовала успешные национальные AI-проекты. Так, Киевстар станет надежным технологическим партнером на старте, поможет обеспечить быстрый запуск и создать LLM, максимально адаптированную к языку и культуре Украины.

Использование украиноязычной модели будет стоить дешевле для украинских пользователей по сравнению с англоязычными аналогами. После разработки и тестового периода модель станет собственностью государства. С момента готовности LLM государство сразу будет иметь к ней доступ для бесплатного использования.

Появление украиноязычной LLM будет способствовать появлению новых AI-стартапов, привлечению международных инвестиций в страну и повышать ВВП благодаря разработке AI-решений для различных секторов экономики.

Основа для национальной модели — одно из open-source решений, без привлечения государственных средств. Первую версию модели планируют запустить до декабря 2025 года.

Источник материала
loader
loader