Улучшенная версия алгоритма Kandinsky 3.1 для создания изображений на основе текстовых описаний стала доступна всем пользователям.
Новая модель, которая была усовершенствована после обучения на специальном корпусе эстетически привлекательных изображений, обеспечивает значительное качественное развитие в области генерирования картинок. Эту новость объявил первый заместитель председателя правления Сбербанка Александр Ведяхин в ходе проведения международной промышленной выставки "ИННОПРОМ. Центральная Азия".
«Мы получили много положительных отзывов и комментариев, которые помогли нам улучшить ее. С сегодняшнего дня Kandinsky 3.1 доступна всем пользователям. Она позволяет любому человеку реализовать свой творческий потенциал, а для профессионалов — это инструмент для более эффективного развития в креативной индустрии», - заявил Ведяхин.
Была введена усовершенствованная функция оптимизации запроса, которая облегчает создание изображений. Эта функция помогает создать подробный образец по введенным пользователем нескольким словам описания. Языковая модель GigaChat Pro тогда уточняет и обогащает образец дополнительными деталями.
В новой версии также улучшена функция inpainting, которая позволяет редактировать отдельные части изображений.
Кроме того, теперь появилась возможность использовать в основном Telegram-боте продвинутую быструю модель Kandinsky 3.1 Flash. Время генерации изображений при помощи этой версии модели по сравнению с базовой моделью сократилось более, чем в 10 раз.
Скоро пользователи смогут воспользоваться возможностью создания изображений в 4К, а также для синтеза изображений, получения вариаций картинок, их смешивания с другими, объединения иллюстраций и текстовых фрагментов, генерации стикеров или же произвести локальные корректировки на изображении, не изменяя целостность композиции (ControlNet). В течение короткого времени появится возможность опробовать обновленную модель генерации видео Kandinsky Video 1.1 на основе текста.