Skywork представляет SkyReels-V2: модель видео на основе искусственного интеллекта с открытым исходным кодом, обеспечивающую генерацию неограниченной
Коротко Видеомодель SkyReels-V2 с открытым исходным кодом на базе искусственного интеллекта от Skywork позволяет генерировать видео неограниченной длины через браузер, поддерживая различные приложения, такие как создание историй и многотемный видеосинтез.
Платформа, специализирующаяся на ИИ-агентах на рабочих местах, Небесная работа объявила, что ее инструмент для создания видео на базе искусственного интеллекта, Скайрилс , представила SkyReels-V2, видеомодель с открытым исходным кодом на основе искусственного интеллекта, способную генерировать видео неограниченной длины напрямую из веб-браузера бесплатно. Веса модели и код вывода теперь общедоступны на GitHub. SkyReels-V2 использует фреймворк Diffusion Forcing, который интегрирует многомодальные большие языковые модели (MLLM), многоэтапное предварительное обучение, обучение с подкреплением и методы диффузионного форсинга для комплексной оптимизации производительности. Эта модель поддерживает множество практических приложений, включая генерацию историй, синтез изображения в видео, направление камеры и последовательное создание многопредметного видео с помощью системы Skyreels-A2.
Фреймворк Diffusion Forcing позволяет генерировать видео бесконечной продолжительности. SkyReels-V2 поддерживает задачи генерации как текста в видео (T2V), так и изображения в видео (I2V), и способен выполнять вывод как в синхронном, так и в асинхронном режимах, с примерами сценариев, демонстрирующими генерацию длинных видео.
Значимым компонентом SkyReels-V2 является SkyCaptioner-V1, модель видеотитров, разработанная для аннотации данных. Эта модель обучается на результатах титров из базовой модели Qwen2.5-VL-72B-Instruct и дополнительных субэкспертных титровщиков, использующих тщательно подобранный набор данных из примерно двух миллионов сбалансированных видео для обеспечения качества аннотаций и концептуального баланса.
SkyCaptioner-V1, созданный на основе Qwen2.5-VL-7B-Instruct, настроен на улучшение производительности субтитров для видео в конкретных областях. Оценки с использованием тестового набора из 1,000 образцов показывают, что SkyCaptioner-V1 достигает более высокой средней точности, чем современные базовые модели, особенно в областях, связанных с кадрами.
Опираясь на предыдущие успехи с большими языковыми моделями, разработчики сосредоточились на повышении качества генеративного видео с помощью обучения с подкреплением, устраняя выявленные ограничения, такие как трудности с большими, деформируемыми движениями и случайные физические несоответствия в генерируемых видео.
Для повышения производительности были реализованы два последовательных этапа контролируемой тонкой настройки (SFT) с разрешением 540p и 720p соответственно. Начальная фаза SFT имела место сразу после предварительной подготовки и перед этапом обучения с подкреплением. Эта первая фаза SFT действует как концептуальный равновесный тренер, уточняя результаты предварительной подготовки базовой модели, которая использовала только видеоданные с частотой 24 кадра в секунду (fps), и упрощая архитектуру путем удаления компонентов внедрения FPS.
Что такое SkyReels?
SkyReels — это платформа для создания видео на основе искусственного интеллекта, которая позволяет пользователям создавать короткие фильмы, анимацию и видео, комбинируя текстовые подсказки, изображения и аудиовходы. Платформа предоставляет широкий спектр функций, включая персонажей, сгенерированных ИИ, инструменты для раскадровки, возможности синхронизации губ, сочинение музыки и редактирование видео, все это разработано для оптимизации процесса создания контента. Она также включает в себя передовые модели ИИ, такие как SkyReels-V1 и SkyReels-V2.
SkyReels-V1 — это модель видеофундамента с открытым исходным кодом, ориентированная на создание видео для коротких драм, ориентированных на человека, поддерживающая как текст в видео и генерация изображений в видео с точной передачей тонких выражений лица и созданием визуальных эффектов кинематографического качества.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Enso готовится к раунду финансирования сообщества на сумму 5 млн долларов на CoinList, предлагая 4% от общего объема предложения токенов
Коротко Enso объявила о раунде финансирования сообщества на сумму 5 миллионов долларов на CoinList, предложив 4% от своего предложения в размере 100 миллионов токенов для поддержки своей единой платформы разработки блокчейна.

Taiko активирует предварительные подтверждения в тестовой сети Hekla для повышения скорости транзакций
Коротко Компания Taiko внедрила функцию предварительного подтверждения в своей тестовой сети Hekla для повышения скорости транзакций перед запуском основной сети Alethia, что ознаменовало собой первый этап двухэтапного обновления в сторону не требующего разрешения секвенирования.

Second Me выпускает репозитории с открытым исходным кодом на GitHub, обеспечивая полностью приватные, персонализированные цифровые двойники ИИ
Коротко Компания Second Me открыла исходный код своей децентрализованной платформы идентификации на основе ИИ, которая позволяет пользователям создавать частные, локально обученные цифровые близнецы, моделирующие личные черты для использования в контекстно-зависимых приложениях и средах совместного ИИ.

Sakana AI представляет Text-to-LoRA: гиперсеть для создания адаптеров LLM для конкретных задач
Коротко Компания Sakana AI представила Text-to-LoRA — гиперсетевой метод, который генерирует адаптеры LoRA для конкретных задач LLM на основе описаний на естественном языке.

Популярное
ДалееЦены на крипто
Далее








