Китайская технологическая компания Tencent представила новую ИИ-модель HunyuanVideo-I2V с открытым исходным кодом, которая позволяет преобразовывать статичные изображения в видеоклипы. Инструмент создаёт видео с разрешением 720p и продолжительностью до 129 кадров (около пяти секунд) на основе текстовых промптов.

HunyuanVideo-I2V основана на модели HunyuanVideo, представленной в декабре 2024 года. Это самая большая в мире модель с открытым исходным кодом для генерации видео, содержащая более 13 миллиардов параметров.

Особенности модели

  • Возможность использования индивидуальных адаптеров LoRA для создания уникальных визуальных стилей и эффектов.
  • Требования к оборудованию: для работы рекомендуется графический процессор с 80 ГБ видеопамяти, минимально необходимо 60 ГБ.
  • Пользователи сообщают, что для менее динамичных сцен достаточно видеокарты RTX 4090 с 24 ГБ памяти.

Контекст

После анонса генеративной ИИ-модели Sora от OpenAI многие компании начали разрабатывать аналогичные инструменты. Например, DeepMind (подразделение Google) представила модель Veo 2, а Meta — Movie Gen для редактирования и создания видео.

Напомним, что в июле 2024 года китайский разработчик Kuaishou сделал доступной свою ИИ-модель Kling для генерации видео.

Изучайте больше о мире криптовалют, инвестировании и трейдинге в академии Cryptemic.


HunyuanVideo-I2V от Tencent демонстрирует растущий интерес к технологиям генерации видео на основе ИИ. Открытый исходный код и возможность кастомизации делают эту модель привлекательной для разработчиков и творческих профессионалов.

ДИСКЛЕЙМЕР

Вся информация, содержащаяся на нашем вебсайте, публикуется на принципах добросовестности и объективности, а также исключительно с ознакомительной целью. Читатель самостоятельно несет полную ответственность за любые действия, совершаемые им на основании информации, полученной на нашем вебсайте.

Добавить комментарий

Больше на Cryptemic.com

Оформите подписку, чтобы продолжить чтение и получить доступ к полному архиву.

Читать дальше