Новости компаний
Сбер открыл доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке
Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке. Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT*).
20.07.2023, 15:16


ruGPT-3.5

Внутри GigaChat находится целый ансамбль моделей — NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 млрд параметров (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B.

Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов. Финальный чекпоинт модели — это базовый претрейн для дальнейших экспериментов.

Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub. В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.

mGPT

Также в открытом доступе опубликована многоязычная модель mGPT 13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 млрд параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей.

Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub. 

Андрей Белевцев, старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка:

«Сбер как ведущая технологическая компания выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому, мы уверены, что публикация обученных моделей подстегнёт работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами».

*Лицензия MIT (англ. MIT License) — лицензия открытого и свободного программного обеспечения, разработанная Массачусетским технологическим институтом.

Автор: Nurtdinova
Другие новости рубрики
Глава ВТБ Андрей Костин: «Снижение ключевой ставки возможно не раньше середины 2025 года»
Новости компаний
Глава ВТБ Андрей Костин: «Снижение ключевой ставки возможно не раньше середины 2025 года»
В ВТБ не ждут снижения ключевой ставки Банка России раньше середины следующего года.
6.09.2024, 17:08
ВТБ: почти 60% жителей Поволжья хотели бы провести отпуск на Дальнем Востоке
Новости компаний
ВТБ: почти 60% жителей Поволжья хотели бы провести отпуск на Дальнем Востоке
По результатам опроса* ВТБ к ВЭФ-2024, 59% жителей Приволжского федерального округа хотели бы провести отпуск на Дальнем Востоке.
6.09.2024, 15:09
Сбер ожидает небольшого снижения цен на жилье в ближайшие месяцы
Новости компаний
Сбер ожидает небольшого снижения цен на жилье в ближайшие месяцы
Сбер ожидает небольшого снижения цен на жилье в ближайшие месяцы, что на фоне роста реальных доходов населения увеличит доступность жилья.
6.09.2024, 12:50
Новости компаний
Отделения крупнейшего российского банка можно будет посещать с домашними животными
ВТБ планирует обновить три четверти своих отделений, сделав в них кофе-зоны и детские уголки.
5.09.2024, 15:03
Новости компаний
ВТБ проанализировал эффективность вложений в инфраструктурные проекты
По оценкам ВТБ, каждый рубль инвестиций в инфраструктурный проект, если он тщательно проработан и грамотно структурирован, дает экономике 3–5 руб. в виде прямых и косвенных эффектов на горизонте...
5.09.2024, 15:01
Новости компаний
Зампред Сбера рассказал о защищенности оплаты по биометрии от мошенников
Заместитель председателя правления Сбербанка Станислав Кузнецов на полях Восточного экономического форума рассказал о защищенности сервисов оплаты по биометрии, в частности, «Оплаты улыбкой».
5.09.2024, 14:56
Сбер снизил ставку по торговому эквайрингу для новых клиентов
Новости компаний
Сбер снизил ставку по торговому эквайрингу для новых клиентов
Сбер предложил новым корпоративным клиентам специальные условия по эквайрингу: если оплата пройдёт по QR или биометрии ставка по эквайрингу составит всего 0,3%, а если покупатель оплатит покупку на...
5.09.2024, 13:24
ВТБ в Поволжье оказал поддержку туристической отрасли на 46 млрд рублей
Новости компаний
ВТБ в Поволжье оказал поддержку туристической отрасли на 46 млрд рублей
За семь месяцев 2024 года ВТБ предоставил клиентам среднего и малого бизнеса из сферы туризма и гостеприимства более 1 тысячи кредитов на 139 млрд рублей.
4.09.2024, 17:16
Александр Ведяхин: Люди, использующие искусственный интеллект, точно будут опережать всех, кто им не пользуется
Новости компаний
Александр Ведяхин: Люди, использующие искусственный интеллект, точно будут опережать всех, кто им не пользуется
Люди, использующие искусственный интеллект, точно будут опережать всех, кто им не пользуется. При этом нужно понимать возможные риски от внедрения новых технологий.
4.09.2024, 16:15