Искусственный интеллект от Google преобразует текст в картинки

Google представила Imagen — модель, трансформирующую текстовое описание в фотореалистичное изображение

Искусственный интеллект от Google преобразует текст в картинки

Модель искусственного интеллекта преобразует текстовое описание в реалистичные изображения

Компания Google представила Imagen — модель, трансформирующую текстовое описание в изображение c разрешением 1024×1024 пикселей. Imagen превзошла более раннюю нейросеть OpenAI DALL-E 2  также работавшую с парами текст-картинка по степени реалистичности изображений.

Imagen является комбинацией языковых моделей-трансформеров, используемых для обработки текстового описания, и диффузных моделей для генерации изображений с последовательным улучшением разрешения. Модель была обучена на наборе данных LAION-400M, содержащем более 400 миллионов пар изображение-текст, взятых из Интернета.

Google протестировала Imagen в сравнении с DALL-E 2 с помощью оценок тестировщиков. По итогам этого теста большинство положительных оценок получила модель Google. Помимо этого, Imagen достигла нового state-of-the-art значения FID 7,27 в наборе данных COCO, хотя не обучалась на изображениях из этого датасета.

В дополнение к Imagen Google представила комплексный бенчмарк text-to-speech моделей DrawBench. На текущий момент компания решила не выпускать модель в открытый доступ, поскольку она подвержена предвзятости данных из обучающего датасета. Посмотреть примеры сгенерированных изображений можно по ссылке.

Источник: Neurohive Прокомментируйте первым!
Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

  • Глобальный рост криптовалют: ключевые тренды, которые формируют новую финансовую реальность

    Криптовалютный рынок в 2024–2025 годах окончательно закрепился как полноценный сектор глобальной экономики. Он уже не воспринимается как «эксперимент» или нишевый инструмент гиков. Международные банки, корпорации, платёжные системы и фонды активно интегрируют цифровые активы в свои стратегии. На фоне роста регуляторной ясности, расширения инфраструктуры и появления новых классов инвесторов, роль криптовалют в мировой финансовой системе стремительно…

  • Эволюция брендбуков: как менялись подходы к корпоративной идентичности за последние 20 лет

    За последние два десятилетия роль брендбука в бизнесе претерпела кардинальные изменения. Если раньше он воспринимался как статический набор правил по использованию логотипа и цветовой гаммы, то сегодня это динамичный инструмент, отражающий стратегию, ценности и характер компании. Интересно, что спрос на подобные документы растет: для многих руководителей вопрос разработки брендбука связан не только с визуальной айдентикой,…

  • Хранение данных: почему это важно в современном мире

    В эпоху цифровизации хранение данных стало одной из ключевых задач для компаний и организаций по всему миру. Данные сегодня – это не только информация о клиентах и транзакциях, но и основной ресурс для анализа, прогнозирования, развития искусственного интеллекта и создания инновационных сервисов. Объем данных, создаваемых предприятиями, частными пользователями и устройствами Интернета вещей (IoT), растет с…

Have no product in the cart!
0