Нейросеть от «Сбера» научили генерировать тексты на 61 языке мира

Входящая в экосистему СберБанка, компания SberDevices сообщила о создании многоязычной версии нейросети GPT-3

Нейросеть от «Сбера» научили генерировать тексты на 61 языке мира

Экосистема Сбера пополнилась нейросетью, способной создавать тексты на 61 языке

Входящая в экосистему СберБанка, компания SberDevices сообщила о создании многоязычной версии нейросети GPT-3 — нейросеть, именуемая mGPT может создавать тексты на различных языках мира. Всего поддерживается 61 язык, в список которых входят в том числе языки народов России и стран СНГ.

По словам представителей пресслужбы, mGPT — это уникальная генеративная модель, которая поддерживает такое значительное количество языков. нейросеть доступна в двух вариантах: базовой, с 1,3 миллиарда параметров, опубликованной в открытом доступе в облачном хранилище «СберДиск», и расширенной, с 13 миллиардами параметров, которая скоро станет доступна на платформе машинного обучения ML Space от SberCloud.

Причем эта модель может использоваться как просто для создания текста, так и для решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе нескольких моделей. 

Например, можно научить автоматизированную систему отвечать на вопросы, определять эмоциональную окраску текста, извлекать из текста имена, фамилии, названия компаний и тому подобное. Модель может также использоваться как компонент различных речевых технологий — например, для улучшения качества распознавания речи, генерации сценариев диалоговых систем и так далее.

Чтобы понять масштабность приведем перечень поддерживаемых языков, доступный в модели mGPT: азербайджанский, английский, арабский, армянский, африкаанс, баскский, башкирский, белорусский, бенгали, бирманский, болгарский, бурятский, венгерский, вьетнамский, голландский, греческий, грузинский, датский, иврит, индонезийский, испанский, итальянский, йоруба, казахский, калмыцкий, киргизский, китайский, корейский, латышский, литовский, малайский, малаялам, маратхи, молдавский, монгольский, немецкий, осетинский, персидский, польский, португальский, румынский, русский, суахили, таджикский, тайский, тамильский, татарский, телугу, тувинский, турецкий, туркменский, узбекский, украинский, урду, финский, французский, хинди, чувашский, шведский, якутский, японский.

Прокомментируйте первым!
Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

  • Эволюция брендбуков: как менялись подходы к корпоративной идентичности за последние 20 лет

    За последние два десятилетия роль брендбука в бизнесе претерпела кардинальные изменения. Если раньше он воспринимался как статический набор правил по использованию логотипа и цветовой гаммы, то сегодня это динамичный инструмент, отражающий стратегию, ценности и характер компании. Интересно, что спрос на подобные документы растет: для многих руководителей вопрос разработки брендбука связан не только с визуальной айдентикой,…

  • Хранение данных: почему это важно в современном мире

    В эпоху цифровизации хранение данных стало одной из ключевых задач для компаний и организаций по всему миру. Данные сегодня – это не только информация о клиентах и транзакциях, но и основной ресурс для анализа, прогнозирования, развития искусственного интеллекта и создания инновационных сервисов. Объем данных, создаваемых предприятиями, частными пользователями и устройствами Интернета вещей (IoT), растет с…

  • Математика онлайн: как репетиторы помогают преодолеть трудности и полюбить царицу наук

    Математика – предмет, который вызывает у многих школьников трепет и непонимание. Страх перед контрольными, сложности с домашними заданиями, неуверенность в своих силах – эти проблемы знакомы многим. Но современные технологии и развитие онлайн-образования открыли новые, доступные и эффективные пути для освоения этой непростой, но такой важной науки. Репетитор онлайн – это не роскошь, а реальная…

Have no product in the cart!
0