首页财产ai正文 Seedance 2.0火出圈,象征着AGI又近了一步 自字节跳动开启 Seedance 2.0最先灰度测试,不到48小时,X、抖音等社交平台布满了遮天蔽日各类基在该模子的 AI 视频。 2026-02-11 07:50 ·字母榜作者 苗正 ,编纂 王靖 AI投资人解读· Seedance 2.0撑持多模态输入,于物理模仿、编纂能力、视听结合天生等方面有改良,天生速率晋升,Pro版本上风较着,其肉搏视频受存眷,揭示出靠近人类的认知闭环。 · 存于版权危害,此前Sora 2留存率低、因版权问题掉去流传动力。 总结:Seedance 2.0依附技能上风爆火,有潜力成为创作东西,但需应答版权危害,字节要使用生态上风转化流量与技能,不然可能好景不常。内容由AI天生,仅供参考
“今朝暂不撑持输入真人素材作为主体参考。咱们深知创意的界限是尊敬。”
这是打开即梦web平台时用户看到的提醒。就于前一天,Seedance 2.0因真人肖像天生能力激发争议,字节跳动紧迫下线了真人人脸素材参考功效。
激发禁令的是影视飓风Tim于凌晨发布的一条视频,他说Seedance 2.0是“转变视频行业的 AI”,可他的语气其实不是惊叹,而是一种警省。
缘故原由是他发明,仅上传本身的人脸照片,模子就能主动天生与他本人高度相似的声音,甚至精准匹配语气特质。真实地让人感应畏惧。
但于功效下线以前,Seedance 2.0已经经完成为了一次征象级的出圈。《黑神话·悟空》建造人冯骥于微博上称其为“当前地表最强的视频天生模子”,并正告“传神的视频将变患上毫无门坎”。
印象中于此以前,冯骥赐与这么高评价的,也就是DeepSeek。
自字节跳动开启 Seedance 2.0最先灰度测试,不到48小时,X、抖音等社交平台布满了遮天蔽日各类基在该模子的 AI 视频。
《火影忍者》、《咒术回战》、《奥特曼》……基本上你能想到的作品全都有。
海外反映一样炸裂。X 平台上,一名进修7年纪字影戏建造的用户发帖:“这是*让我感应畏惧的模子,90% 我学到的技术它都能实现。”
AIGC圈年夜佬,Sensive及KidsHackClub的结合开创人莱纳斯·埃肯斯塔姆(Linus Ekenstam)直接答复这条X说:“它会让互联网瓦解,百分之百。”Hacker News上,更是有人直言“这是2026年*的视频模子,逾越Sora 2”。
逾越Sora尚于其次,更主要的是,物理世界的正确建模被视为通用AGI的要害能力之一,而Seedance 2.0让业内子士看到了实现这一点的可能性。
2月9日,A 股的传媒、短剧、AI 运用板块也跟着 Seedance 2.0 的爆火而团体年夜涨。上海影戏、*世界等公司单日涨幅达 10%,阐发师预期该模子将年夜幅降低建造成本、加快内容出产周期。
爆火暗地里,问题一样锋利。
Sora 2可以说是前车可鉴。刚推出时,Sora 2好评如潮,然而仅仅已往两个月,留存率就无穷靠近在零。除了此以外,版权危害、数字授权等问题,也已经经于Sora 2上面袒露过一次了。
字节会带着Seedance 2.0,找到另外一条前途吗?
0一、甚么是Seedance 2.0
于相识Seedance 2.0火爆以前,没关系让咱们先来熟悉一下它。
Seedance 2.0撑持文本、图片(至多 9 张)、视频(至多 3 段,总长≤15 秒)、音频(至多 3 段,总长≤15 秒)同时输入,混淆上限 12 个文件。
用户可用图片界说构图及脚色、视频指定动作及镜头运动、音频驱动节拍。
比拟之下,Sora 2的Cameo功效仅撑持单张照片植入,Veo 3及Kling 2.6重要依靠文本加单图输入。
这类多模态能力不是简朴的素材叠加。字节引入了@说起体系,如许就能明确节制每一个资源。
于提醒词中,用户可以写“ @Image1作为*帧,参考@Video1的运镜,利用@Audio1作为配景音乐节拍”。
其*的利益就是,转变了以往“扔一堆素材给AI,然后试试看”的创作模式。
模子采用“Seedance V2运动合成”技能,于重力、动量、碰撞、流体等物理征象的模仿上有较着改良。
实测显示,布料飞舞、液体飞溅、肢体运动的轨迹更靠近真什物理纪律,削减了“漂浮感”及物体穿模等常见伪影。
Seedance 2.0还有有一个很主要的能力就是精准首尾帧。
用户上传肇始帧与竣事帧图象后,模子智能推演中间动态历程,确保转场天然、节拍不变。这对于告白定格动画、剧情跟尾等强节制需求场景尤其有效。
分镜驱动视频天生撑持按分镜剧本逐镜天生,跨镜头维持脚色外不雅、光影逻辑与美术气势派头一致性。有效户用Lovart的Skill天生分镜故事板,直接复制到Seedance 2.0中,天生的视频比用ComfyUI手工调参做的还有过细。
这申明模子不仅理解单个画面,还有理解镜头之间的叙事逻辑。
Seedance 2.0的编纂能力也获得了加强,撑持对于已经有视频举行脚色更替、删减、增长。用户可以直接于天生成果中编纂局部画面,而不是推倒重来。这年夜幅晋升了成片率,也让创作流程更靠近传统视频编纂的体验。
从单一提醒词可天生包罗多个镜头切换的完备片断。
模子能主动计划分镜、履行运镜(如渐进、环抱、追随)、添加剪辑效果(如慢动作、镜头抖动)。多镜头间连结脚色脸部特性、服装细节、场景光照、叙事基调的一致性,过渡较为天然。
末了就是视听结合天生方面,音频与视觉于创作历程中彼此影响。
撑持8种以上语言的音素级口型同步,情况音效与视觉事务及时对于应。脚步声匹副角色挪动,玻璃破碎陪同响亮音效。上传音频可驱动视频天生,BGM节奏对于应镜头切换。
经由过程火山引擎RayFlow优化,天生速率比1.0版本晋升约30%。10秒1080p带音频视频约需2-5分钟。Pro版本撑持原生2K分辩率,视频可延伸至2分钟,比拟Sora 2的15秒上限及Kling 2.6的10秒限定有较着上风。
脚色一致性机制引入加强版“身份长期性”留意力机制,于差别镜头、角度、光照前提下连结脚色特性不变。脸部轮廓、发型、服装纹理等细节于镜头切换时漂移较少。
0二、出圈竟是由于AGI?
于X、抖音等社交媒体上,Seedance 2.0最受存眷的内容集中于热点IP脚色的肉搏与动作视频:真人版七龙珠战斗、奥特曼对于决、运动告白。
这种内容的点赞数遍及于数十万级别。
从视频的不雅感来说,动作场景对于物理模仿精度要求极高,任何掉真城市粉碎可托度。
拳击手出拳时的重心转移、击中方针的形变反馈、被击者撤退退却间隔需切合力学纪律。AIGC艺术家DynamicWang用Seedance 2.0建造的Nike风告白中,四位女性的肌肉线条、动作幅度与其运动项目(体操、拳击、跑步、游泳)高度匹配。

体操翻转、技击持续踢腿、跑酷墙面反弹等动作链条中,任何一帧的速率、角度、加快度误差城市孕育发生“机械感”。Seedance 2.0经由过程时序一致性建模,使动作流利度靠近实拍效果。
肉搏时的扬尘、兵器破风声、衣袂翻飞的褶皱等二次物理效应加强了场景真实感。
物理世界的正确建模被视为通用AGI的要害能力之一。
“物体怎样运动”“力怎样通报”“因果怎样发生”,虽然这些工作对于咱们早已经习以为常了,可是对于在AI这还有是新鲜事。
当AI模子能正确猜测拳头击中方针后的形变、水花溅起的轨迹、布料随风飞舞的形态,象征着它再也不是简朴的“像素天生器”,而是成立了对于真实世界运作机制的内部表征。
杨立昆曾经屡次夸大,AGI必需具有对于物理世界的知识性理解。
Seedance 2.0于物理模仿上的晋升,素质上是其世界模子能力的加强,模子最先理解物体之间的瓜葛、动作的因果链条、情况对于物体的约束。
传统天生模子依靠“数据中呈现过甚么,就天生甚么”的统计纪律,然而真实世界遵照因果逻辑,推倒多米诺骨牌,后续骨牌一定倒下;拳头击中面部,头部一定后仰。
Seedance 2.0可以或许天生切合物理纪律的肉搏视频,申明模子内部已经经形成为了某种因果推理能力。
它不是记住了“拳击的样子”,而是理解了“力的作用一定孕育发生反作用”这一底层逻辑。这类能力是从“模式辨认”向“观点推理”的超过。
传统AI是逗留于统计层面的拟合,只有当AI理解了物理世界,才能真正与实际交互。
这也是为何以前各年夜厂一直夸大多模态。
由于我们人类的年夜脑理解物理世界,素质上就是多模态。咱们经由过程视觉看到物体运动,经由过程听觉感知碰撞声响,经由过程触觉理解材质硬度,这些感官信息于年夜脑中交融形成同一的世界理解。
前文提到的Seedance 2.0视听结合天生架构,于某种水平上就是模仿了这类多模态交融机制。
当模子可以或许理解“重物落地应该发出低落声音”“玻璃破碎应该陪同响亮音效”时,它已经经于成立跨模态的因果联系关系。这类能力远超纯真的文本天生或者图象天生,已经经预示着模子正朝着AGI挨近了。
还有有一点,当前AI研究的共鸣是,AGI终极需要表现于具身智能上。
缘故原由很简朴,一个可以或许于物理世界中步履的智能体,不管是呆板人还有是主动驾驶,都要求AI正确猜测物理世界的动态变化。
Seedance 2.0虽然是视频天生模子,但它对于物理纪律的理解能力(重力、动量、碰撞、流体力学)与具身智能所需的能力高度重合。
可以说,视频天生是具身智能的“沙盒”。
模子于虚拟世界中学会了物理纪律,将来可以迁徙到真实世界的呆板人节制中。而基在Seedance 2.0的那些肉搏视频,恰好集中表现了模子对于力学、运动学、时序因果的综合理解,这些都是具身智能的焦点能力。
GPT、Claude等年夜语言模子虽然强盛,但它们对于物理世界的理解是间接的、基在文本描写的。它们可以告诉你“苹果会失下来”,但没法真正“看到”重力怎样作用。
Seedance 2.0的冲破于在,它经由过程视频天生这一使命,被迫进修物理世界的直接表征。
这使患上它于通往AGI的路径上比纯语言或者静态图象模子走患上更远,以是它的运行逻辑更靠近人类“看到-理解-猜测”的认知闭环。
假如说语言模子是AGI的“左脑”(逻辑与符号),那末物理世界模子就是AGI的“右脑”(空间与直觉)。
Sora 2于静态场景及慢节拍叙事上体现较好,但于快速动作场景存于较着短板。篮球弹跳轨迹、水流形态、布料飞舞出现“梦幻感”而非“真实感”,慢镜头下尤为较着。
脚色快速位移(冲刺、跳跃、挥拳)时轻易孕育发生运动恍惚过分或者肢体变形,源在扩散模子处置惩罚时序猛烈变化的局限。
Sora 2 要天生单镜头,用户拼接多个动作片断时,脚色动作跟尾、速率一致性难以包管。
肉搏视频需要“出招-闪避-还击”的多回合布局,这是Sora 2的弱项。社交媒体上Sora 2天生的同类内容常因“动作僵直”“物理背及”被用户攻讦。
字节于短视频范畴的数据堆集多是上风来历。
抖音逐日处置惩罚数十亿条视频,这些数据帮忙模子理解“甚么样的运动吸引眼球”“哪一种节拍让人连续不雅看”。模子练习可能利用了年夜量真实技击、体育、跳舞视频作监视旌旗灯号。
0三、字节能从Sora 2上吸取教训吗?
OpenAI将 Sora 2 定位为“AI 版抖音”。首日10万安装(约请制 iOS)、4天登顶美国App Store总榜、5天破100万下载(快在 ChatGPT)。
但Appfigures数据显示,Sora 2于60天内的下载量呈现断崖式下滑。12月环比降落32%,1月环比年夜幅降落45%,降至约120万次。
截至发稿,Sora 2今朝已经跌出美国App Store免费运用总榜前100名。
Sora 2*的战略掉误是试图复制抖音那套社区文化。
AI天生内容自然缺少真实人际瓜葛,这是社交收集的焦点之一。用户于抖音上刷到的是真正的人、真正的糊口片断、真正的感情毗连。而Sora 2天生的视频,不管何等精致,素质上都是算法的产品,缺少社交收集赖以保存的人际纽带。
Seedance 2.0今朝的做法更务实,嵌入剪映、即梦等成熟创作东西,作为“功效模块”而非“自力 App”。
将本身定位为创作者东西箱的一部门。用户不是来“刷AI视频”,而是来“用AI做视频”。这个定位差异,决议了产物的生命周期。
Sora 2于版权上的摇晃袒露了西方羁系情况的困境。
上线早期,因缺少严酷管控,用户曾经可天生海绵宝宝、皮卡丘等知名IP脚色的视频,这虽于必然水平上有助在初期推广,但激发了版权方的强烈否决。
面临压力,OpenAI将版权利用法则从“默许可选”改成“需明确授权”,也恰是由于这类版权内容的变动,致使Sora 2掉去了最初病毒式流传的动力源泉。
今朝来看,Seedance 2.0另外一年夜爆火的缘故原由,是创作者使用AI天生了奥特曼、七龙珠等年夜量知名脚色,但一样存于版权危害,好比下图中就是赵本山及詹姆斯。
字节因真人素材参考能力激发争议后,已经紧迫下线该功效。这申明字节于版权问题上采纳了更审慎的立场,试图于技能能力与合规危害之间找到均衡点。
但最主要的是,当任何人都能于几分钟内天生一段精致视频,内容自己就掉去了稀缺性。用户真正需要的不是“更多视频”,而是“更成心义的表达”。
技能再强,假如不克不及回覆“用户为何需要这个”的问题,终极城市沦为玩具。
AI天生的视频虽然精致,但往往缺少焦点的感情内核与连续的叙事价值。很多用户于社交平台上反馈,于最初的新鲜感褪去后,Sora 2天生的内容逐渐趋同且无趣。
Seedance 2.0若想持久存活,需要回覆一个问题:于AI让视频天生成本趋近在零的时代,你为用户创造的焦点价值是甚么?是节省时间?是实现创意?还有是成立身份认同?
从今朝的产物计谋来看,字节选择了“东西”而非“平台”的线路。
但东西线路也有本身的挑战。当可灵、Sora、Veo都于提供近似能力时,用户凭甚么选择 Seedance 2.0?谜底可能不于技能自己,而于生态整合的深度。
字节拥有抖音、剪映、即梦的完备创作生态,Seedance 2.0假如能与这些产物深度买通,形成从灵感应发布的闭环,就能成立起其他竞争敌手难以复制的护城河。
不外归根结柢,版权问题是永远不会消散的,技能能力的界限也会不停被竞争敌手追平。真正决议Seedance 2.0运气的,是字节可否于爆火的窗口期内,将流量转化为用户习气,将技能上风转化为生态壁垒。
谜底可能决议了它是成为字节的下一个抖音,还有是下一个 Sora 2。
【本文由投资界互助伙伴字母榜授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-雷火·竞技