Искусственный интеллект от Google преобразует текст в картинки

Google представила Imagen — модель, трансформирующую текстовое описание в фотореалистичное изображение

Искусственный интеллект от Google преобразует текст в картинки

Модель искусственного интеллекта преобразует текстовое описание в реалистичные изображения

Компания Google представила Imagen — модель, трансформирующую текстовое описание в изображение c разрешением 1024×1024 пикселей. Imagen превзошла более раннюю нейросеть OpenAI DALL-E 2  также работавшую с парами текст-картинка по степени реалистичности изображений.

Imagen является комбинацией языковых моделей-трансформеров, используемых для обработки текстового описания, и диффузных моделей для генерации изображений с последовательным улучшением разрешения. Модель была обучена на наборе данных LAION-400M, содержащем более 400 миллионов пар изображение-текст, взятых из Интернета.

Google протестировала Imagen в сравнении с DALL-E 2 с помощью оценок тестировщиков. По итогам этого теста большинство положительных оценок получила модель Google. Помимо этого, Imagen достигла нового state-of-the-art значения FID 7,27 в наборе данных COCO, хотя не обучалась на изображениях из этого датасета.

В дополнение к Imagen Google представила комплексный бенчмарк text-to-speech моделей DrawBench. На текущий момент компания решила не выпускать модель в открытый доступ, поскольку она подвержена предвзятости данных из обучающего датасета. Посмотреть примеры сгенерированных изображений можно по ссылке.

Источник: Neurohive Прокомментируйте первым!
Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

  • Санкционные послабления для Dana Holdings: что меняется на практике

    Сообщения о снятии санкций с девелопера Dana Holdings воспринимаются как значимое событие, однако их реальное влияние на строительный рынок Беларуси остается ограниченным. Речь идет не о комплексной отмене ограничений, а о решениях в рамках отдельных юрисдикций. Санкционная архитектура Запада фрагментирована: даже при ослаблении мер со стороны США европейский режим продолжает действовать самостоятельно. В результате формальный…

  • Google завершает год масштабным апдейтом: December 2025 Core Update уже влияет на выдачу

    В середине декабря Google запустил December 2025 Core Update — одно из самых значимых обновлений поискового алгоритма в этом году. Развертывание апдейта стартовало 11 декабря и, по прогнозам компании, продлится около двух–трех недель. На протяжении всего этого периода поисковая выдача будет нестабильной, а сайты в разных нишах могут столкнуться с резкими изменениями позиций и органического…

  • В мобильном приложении Сервиса «Granat» Банка «МБА-МОСКВА» запущены денежные переводы из России в Узбекистан

    В мобильном приложении Сервиса «Granat» Банка «МБА-МОСКВА» запущены денежные переводы из России в Узбекистан Банк «МБА-МОСКВА» объявил о запуске денежных переводов из России в Узбекистан в мобильном приложении Сервиса денежных переводов «Granat». Перевод можно отправить с карты любого российского банка без комиссии и каких-либо скрытых платежей. Переводы отправляются в российских рублях, при этом – зачисление производится…