>昆仑万维SkyReels-V2:开启无限时长AI视频生成新纪元
昆仑万维最新升级的SkyReels-V2视频生成模型正式亮相,标志着AI视频生成领域迎来了无限时长的全新时代。这款全球首个无限时长视频生成模型不仅实现了电影级的理解能力,还全面开源,为整个行业带来了颠覆性的变革。
下面来实测一下
首先prompt:
>冬日傍晚的欧洲小镇火车站,雪花缓缓飘落,蒸汽列车缓缓进站。穿驼色大衣的男主角(30岁,忧郁气质)站在月台尽头,手中捏着一封泛黄的信件。穿红色连衣裙的女主角(28岁,优雅卷发)从车厢走出,两人在人群中四目相对,时间仿佛静止。暖金色路灯与冷蓝色暮光交织,雪花在逆光中闪烁,浅景深突出人物表情,背景虚化为复古站钟和熙攘旅客。电影级柔焦,柯达Portra胶片色调,略带颗粒感,构图致敬《爱在黎明破晓前》的长镜头美学。
prompt:
两个人拥抱在一起
prompt:两人拥吻
........
prompt:两个人聊天
反复进行>Extend,就可以使视频延长时间

最后得到视频:
SkyReels-V2的核心突破在于其扩散强迫(Diffusion Forcing)技术,该技术将传统扩散模型转化为支持无限长度生成的架构。通过帧导向概率传播(FoPP)时间步调度器、自适应差异(AD)时间步调度器和上下文因果注意力三个关键点的结合,SkyReels-V2能够以前一视频段的最后几帧为条件,生成新的帧序列,理论上支持无限长度的扩展。这种技术的应用使得视频内容在保持连续性和一致性的同时,还能够实现高质量的动态运动效果。

不仅如此,SkyReels-V2在专业维度上也表现出色。研发团队针对性地训练了多个专家级模型,包括镜头标注器、表情标注器和摄像机运动标注器等,这些模型在镜头类型、角度与位置的识别上分别取得了82.2%、78.7%和93.1%的准确率。这些专家模型与基础多模态大语言模型(MLLM)的知识被蒸馏到统一的SkyCaptioner-V1模型中,形成了一个平均准确率达76.3%的专业视频标注系统,尤其在镜头相关字段上表现突出。
通过一系列实测,SkyReels-V2展现了其在视频生成领域的强大能力。无论是扩展已有视频片段,还是从静态图片开始生成视频,SkyReels-V2都能够精准地遵循提示,生成具有高度连贯性和视觉质量的视频内容。这种能力使得SkyReels-V2在SkyReels-Bench评估中取得了显著进展,同时在VBench1.0自动化评估中,以总分83.9%和质量分84.7%的成绩优于所有对比模型。
>SkyReels-V2达到这样的视频效果,主要在于:
>1. 影视级视频理解模型:SkyCaptioner-V1
>2. 对运动的偏好优化
>3. 有高效的扩散强迫框架
>4. 渐进式分辨率预训练与多阶段后训练优化的改变
昆仑万维的SkyReels-V2不仅仅是一项技术突破,更是一种新型创作哲学的雏形。它使得人类的角色从执行者转变为“创意导演”,专注于概念构思与审美判断等高层次创造活动。这种人机协作模式将艺术创作的重心从技艺展示转向思想表达,为创意内容产业注入了新的活力。
据高盛预测,到2027年AI生成视频市场规模将突破亿美元,而昆仑万维SkyReels-V2的横空出世,正以“无限时长+电影级质量+精准控制”三位一体的突破性技术,率先打开这片蓝海市场。未来,随着技术的不断进步和应用场景的拓展,SkyReels-V2及其后继技术将继续改写创意产业的DNA,引领行业走向更加智能化、高效化的新时代。
>最后体验地址放在这里:
>SkyReels官网地址:
>https://www.skyreels.ai/home
>GitHub地址:
>1、https://github.com/SkyworkAI/SkyReels-V2
>2、https://github.com/SkyworkAI/SkyReels-A2
>HuggingFace地址:
>1、https://huggingface.co/collections/Skywork/skyreels-v2-6801b1b93df627d441d0d0d9
>2、https://huggingface.co/Skywork/SkyReels-A2
>论文地址:
>1、https://arxiv.org/abs/2504.13074
>2、https://arxiv.org/pdf/2504.02436
转载请注明出处: CHATWEB
本文的链接地址: https://www.chatweb.com.cn/post-177.html
-
开抢!腾讯官宣 28000 HC!
5天前
-
扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)
2025/04/19
-
深藏不露!Kimi这8个隐藏用法,高手都偷偷收藏了,再不学习就晚了!(上)
6天前
-
我用AI「 高德 MCP+ cursor」 解决了日常最大难题“吃什么”!5分钟就搞定吃什么!
2025/04/19
-
[AI工具箱] OneLine:一个由AI优化的时间线工具,如何帮你高效『吃瓜』?
5天前
-
华为电脑管家接入了四家大模型,却是“果篮式”的拼凑
2025/04/19
-
28000个实习岗位,腾讯发起史上最大就业计划
5天前
-
一文全懂:最牛AI公司OpenAI公司治理权斗背后的最创新股权设计
6天前
-
扣子(Coze)怎么搭建工作流?
2025/04/19
-
Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B
6天前
暂无评论