中外视频生成模型激战正酣:MiniMax、Midjourney领衔技术革新,中国军团领跑全球赛道

导读

全球视频生成模型领域迎来新一轮爆发期。6月18日,国内AI独角兽MiniMax发布新一代视频大模型Hailuo 02,以10秒1080P全高清视频和极致动态特效刷新行业标杆;

与此同时,海外巨头Midjourney推出首代视频模型V1,凭借美学基因与亲民定价开辟差异化赛道。两大玩家同日”亮剑”,标志着中美企业在AI视频赛道的竞争进入白热化阶段。

文字编辑|宋雨涵

1

MiniMax Hailuo 02

以技术硬实力定义行业新标准

MiniMax于”MiniMaxWeek”技术发布会上推出的Hailuo 02模型,首次实现10秒级长视频生成能力,支持原生1080P分辨率输出,相较此前行业主流的720P实现了质的跨越。据官方实测数据显示,该模型在复杂动态场景建模上表现惊艳:狮子跃火圈、小丑抛接球等高难度镜头均能保持动作连贯性与物理真实性,网友直呼”墙体碎裂细节堪比电影级特效”。

Hailuo02 核心亮点:

  • 1080P全高清输出:Hailuo 02模型支持Native 1080P视频输出,比以往的720P有了质的飞跃;
  • 10秒超长动态:支持10秒超长一镜到底视频,续航更持久、叙事更连贯;
  • 强化动态特效与物理表现:官方强调其“superior video dynamic effects, enhanced command responsiveness”,确保动作流畅自然、镜头可控性增强。

2

Midjourney V1

美学驱动的普惠型视频工具

与MiniMax的技术攻坚不同,Midjourney选择以美学基因切入市场。其视频模型V1延续了品牌标志性的艺术风格,支持用户通过”图像转视频”功能将静态图片转化为5秒短视频,并提供自动/手动双模式运动控制。值得注意的是,该模型创新性地引入”扩展生成”机制,单次任务可产出最长20秒素材,单位成本仅相当于传统图像生成的1/8。

同时,提供两种运动幅度设置:

低运动(Low motion):适用于相机基本不动、主体缓慢运动的场景(如氛围图),但有时可能出现完全不动的情况。

高运动(High motion):适用于相机和主体都大幅度运动的场景,效果更具动态感,不过出错概率相对较高。

关于视频扩展,生成的视频可进行“扩展”操作,每次延长约4秒,最多可延长四次。目前,视频分辨率为480p。

Midjourney祭出杀手锏定价策略——基础版月费仅需10美元,宣称比同类产品便宜25倍以上。这一策略与其在图像生成领域的成功路径高度一致,旨在通过降低创作门槛快速占领C端市场。目前虽仅开放网页端,但其”松弛模式”无限生成等权益已引发创作者群体高度期待。

全球竞速:

中国军团主导创新话语权

从OpenAI Sora到Google Veo,从字节即梦到快手可灵,视频生成模型已成为全球AI巨头必争之地。而最新行业格局显示,中国企业正在改写游戏规则——AAVA榜单Top10中本土企业独占七席,前五名包揽四席,这种压倒性优势在科技史上绝无仅有。

技术指标与商业模式的协同创新成为破局关键。MiniMax通过底层模型优化实现性能跃升,Midjourney则以生态整合构建护城河,二者分别代表了”技术优先”与”体验为王”的两条发展路径。随着Meta、Adobe等巨头加速入场,这场关乎下一代内容生产范式的争夺战必将更加精彩纷呈。

“视频生成的下一个战场将是实时交互与物理仿真。”无论是MiniMax的物理引擎突破还是Midjourney的世界模型构想,都指向同一个终极目标——打造可交互的虚拟现实世界。在这场技术革命中,中国创新力量已然站在了舞台中央。

结语:

“当MiniMax用10秒1080P的动态特效,刷新了我们对‘清晰’与‘真实’的理解;当Midjourney以10美元/月的亲民价格,让视频创作不再是少数人的专利——全球视频生成模型的竞争,早已不再是单纯的技术较量,而是关于‘未来内容如何被创造’的深刻变革。

看看AAVA榜单前十名中七个中国名字,再看看技术指标和商业模式的双重突破:中国力量正以扎实的技术实力和对用户需求的精准把握,重新制定全球AI视频的规则。无论是MiniMax用代码造出以假乱真的物理特效,还是Midjourney用独到美学降低创作门槛,它们都在追问同一个核心:下一代的视频,如何更逼真、更随心所欲、更能打动人?

这场竞争的终点,或许藏在更远的未来图景里:当实时生成互动视频成为日常,当虚拟与现实的界限因物理仿真而模糊,我们终将抵达一个‘想到即看到,看到即触到’的世界。在那里,中国创新早已不是追赶者,而是规则的塑造者和崭新世界的开拓者。”