back to top
10.5 C
Европа
Пятница, 26 сентября, 2025

Alibaba Cloud запустила генератор видео с реалистичной анимацией и открытым доступом

Alibaba Cloud представила новый набор моделей искусственного интеллекта для генерации видео, доступный для всех желающих. В комплект входят четыре модели, включая варианты с 14 млрд и 1,3 млрд параметров, которые демонстрируют высокую точность и качество выполнения задач, значительно превышающее конкурентов.

Эти модели способны преобразовывать текстовые описания и графику в видео с чрезвычайной реалистичностью движений и детализацией изображений. Впервые появилась поддержка текстовых эффектов на китайском и английском языках. Модели успешно справляются со сложными движениями, детализируя пиксели и учитывая физику окружающего мира, что значительно повышает реалистичность конечного продукта.

Согласно результатам тестирования на платформе VBench, модель Wan2.1 достигла 86,22% точности, заняв первое место среди аналогов и став единственным инструментом с открытым исходным кодом, попавшим в топ-5 моделей на Hugging Face. Модель с 14 млрд параметров предназначена для создания видео с богатыми деталями и динамическими сценами, тогда как версия с 1,3 млрд параметров способна генерировать 5-секундные ролики в 480p всего за 4 минуты на ноутбуке.

По сравнению с конкурентами, такими как LTX и Hunyuan, Wan2.1 демонстрирует высокое качество при генерации видео на основе текстовых и графических входных данных. Хотя скорость обработки немного уступает некоторым продуктам, конечный результат компенсирует это.

Модель использует передовую техническую основу видео-VAE, вариационный автоэнкодер, который позволяет создавать изображения высокого качества по сравнению с другими инструментами. Она способна точно воспроизводить сложные телодвижения, плавные изменения сцен и физику, приближенную к реальности.

Все версии Wan2.1 доступны для загрузки на платформах Model Scope и hugging Face, а также через сайт проекта Wan. Пользователи со всего мира могут использовать модели для научных исследований, технических разработок и коммерческих целей.

С 23 апреля 2025 года будет представлено обновление интерфейса, а новый режим Relax Mode позволит бесплатно генерировать видео и изображения. Для тех, кто хочет ускорить процесс и получить доступ к дополнительным функциям, предусмотрена система членства с ежемесячными бонусами, доступом к расширенным инструментам и приоритетной обработкой данных в реальном времени.

- Реклама -