Искусственный интеллект от Google преобразует текст в картинки

Google представила Imagen — модель, трансформирующую текстовое описание в фотореалистичное изображение

Искусственный интеллект от Google преобразует текст в картинки

Модель искусственного интеллекта преобразует текстовое описание в реалистичные изображения

Компания Google представила Imagen — модель, трансформирующую текстовое описание в изображение c разрешением 1024×1024 пикселей. Imagen превзошла более раннюю нейросеть OpenAI DALL-E 2  также работавшую с парами текст-картинка по степени реалистичности изображений.

Imagen является комбинацией языковых моделей-трансформеров, используемых для обработки текстового описания, и диффузных моделей для генерации изображений с последовательным улучшением разрешения. Модель была обучена на наборе данных LAION-400M, содержащем более 400 миллионов пар изображение-текст, взятых из Интернета.

Google протестировала Imagen в сравнении с DALL-E 2 с помощью оценок тестировщиков. По итогам этого теста большинство положительных оценок получила модель Google. Помимо этого, Imagen достигла нового state-of-the-art значения FID 7,27 в наборе данных COCO, хотя не обучалась на изображениях из этого датасета.

В дополнение к Imagen Google представила комплексный бенчмарк text-to-speech моделей DrawBench. На текущий момент компания решила не выпускать модель в открытый доступ, поскольку она подвержена предвзятости данных из обучающего датасета. Посмотреть примеры сгенерированных изображений можно по ссылке.

Источник: Neurohive Прокомментируйте первым!
Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

  • Микрозаймы как двигатель роста экономики: роль и перспективы

    Современная экономика всё больше опирается на малое предпринимательство и гибкие финансовые инструменты. Одним из ключевых элементов этой системы стали микрозаймы — небольшие, краткосрочные кредиты, доступные как населению, так и представителям малого и среднего бизнеса. Однако, с ростом популярности микрозаймов увеличивается и количество предложений на рынке. Важно понимать, что не все микрофинансовые организации работают честно и…

  • Тренды в SEO и цифровом маркетинге: что важно в 2025 году?

    Мир SEO и цифрового маркетинга продолжает стремительно меняться. Алгоритмы поисковых систем, поведение пользователей и технологии требуют от специалистов гибкости и постоянного развития. Ниже — ключевые направления, которые формируют ландшафт SEO и смежных сфер в 2025 году. 1. Семантика важнее ключей Ранжирование больше не зависит от плотности ключевых слов. Современные алгоритмы (включая Google Search Generative Experience)…

  • Образование как ключ к востребованной профессии: кто такой менеджер маркетплейсов и почему он нужен сегодня?

    В условиях стремительных цифровых изменений и развития электронной торговли образование стало важнейшим инструментом адаптации и роста. Сегодня работодатели ценят не только диплом, но и конкретные прикладные навыки, особенно в сферах, где спрос на специалистов превышает предложение. Одной из таких профессий стал менеджер маркетплейсов — человек, который управляет онлайн-продажами на платформах вроде Wildberries, Ozon, AliExpress, Amazon…