QWEN-VLO - генерация картинок, видео, и редактирование всего, что шевелится.
Обновился Qwen3.
Чат у него весь из себя мультимодальный, принимает на вход документы, картинки, видео и даже звук.
А генерит вообще все, что шевелится. Включая видео, анализ изображений и даже брейншторм.
Го тестировать, пока быстро отвечает. Генерация видео довольно шустрая.
https://chat.qwen.ai/
Вот что пишут разрабы:
Сегодня мы рады представить новую модель - Qwen VLo, единую мультимодальную модель понимания и генерации. Эта обновленная модель не только "понимает" мир, но и генерирует высококачественные "воссоздания" на основе этого понимания, действительно преодолевая разрыв между восприятием и творчеством. Обратите внимание, что это предварительная версия, и вы можете получить доступ к ней через Qwen Chat. Вы можете напрямую отправить запрос типа "Создать изображение милой кошки", чтобы сгенерировать изображение, или загрузить изображение кошки и попросить "Добавить шапочку на голову кошки", чтобы изменить изображение.
Подробнее тут:
https://qwenlm.github.io/blog/qwen-vlo/ - поглядите примеры, они довольно убойные
@cgevent
>>Click here to continue<<