中外视频生成模型激战正酣：MiniMax、Midjourney领衔技术革新，中国军团领跑全球赛道

导读

全球视频生成模型领域迎来新一轮爆发期。6月18日，国内AI独角兽MiniMax发布新一代视频大模型Hailuo 02，以10秒1080P全高清视频和极致动态特效刷新行业标杆；

与此同时，海外巨头Midjourney推出首代视频模型V1，凭借美学基因与亲民定价开辟差异化赛道。两大玩家同日"亮剑"，标志着中美企业在AI视频赛道的竞争进入白热化阶段。

文字编辑｜宋雨涵

MiniMax Hailuo 02：

以技术硬实力定义行业新标准

MiniMax于"MiniMaxWeek"技术发布会上推出的Hailuo 02模型，首次实现10秒级长视频生成能力，支持原生1080P分辨率输出，相较此前行业主流的720P实现了质的跨越。据官方实测数据显示，该模型在复杂动态场景建模上表现惊艳：狮子跃火圈、小丑抛接球等高难度镜头均能保持动作连贯性与物理真实性，网友直呼"墙体碎裂细节堪比电影级特效"。

Hailuo 02 核心亮点：

1080P全高清输出：Hailuo 02模型支持Native 1080P视频输出，比以往的720P有了质的飞跃；
10秒超长动态：支持10秒超长一镜到底视频，续航更持久、叙事更连贯；
强化动态特效与物理表现：官方强调其“superior video dynamic effects, enhanced command responsiveness”，确保动作流畅自然、镜头可控性增强。

Midjourney V1：

美学驱动的普惠型视频工具

与MiniMax的技术攻坚不同，Midjourney选择以美学基因切入市场。其视频模型V1延续了品牌标志性的艺术风格，支持用户通过"图像转视频"功能将静态图片转化为5秒短视频，并提供自动/手动双模式运动控制。值得注意的是，该模型创新性地引入"扩展生成"机制，单次任务可产出最长20秒素材，单位成本仅相当于传统图像生成的1/8。

同时，提供两种运动幅度设置：

低运动（Low motion）：适用于相机基本不动、主体缓慢运动的场景（如氛围图），但有时可能出现完全不动的情况。

高运动（High motion）：适用于相机和主体都大幅度运动的场景，效果更具动态感，不过出错概率相对较高。

关于视频扩展，生成的视频可进行“扩展”操作，每次延长约4秒，最多可延长四次。目前，视频分辨率为480p。

Midjourney祭出杀手锏定价策略——基础版月费仅需10美元，宣称比同类产品便宜25倍以上。这一策略与其在图像生成领域的成功路径高度一致，旨在通过降低创作门槛快速占领C端市场。目前虽仅开放网页端，但其"松弛模式"无限生成等权益已引发创作者群体高度期待。

全球竞速：

中国军团主导创新话语权

从OpenAI Sora到Google Veo，从字节即梦到快手可灵，视频生成模型已成为全球AI巨头必争之地。而最新行业格局显示，中国企业正在改写游戏规则——AAVA榜单Top10中本土企业独占七席，前五名包揽四席，这种压倒性优势在科技史上绝无仅有。

技术指标与商业模式的协同创新成为破局关键。MiniMax通过底层模型优化实现性能跃升，Midjourney则以生态整合构建护城河，二者分别代表了"技术优先"与"体验为王"的两条发展路径。随着Meta、Adobe等巨头加速入场，这场关乎下一代内容生产范式的争夺战必将更加精彩纷呈。

"视频生成的下一个战场将是实时交互与物理仿真。"无论是MiniMax的物理引擎突破还是Midjourney的世界模型构想，都指向同一个终极目标——打造可交互的虚拟现实世界。在这场技术革命中，中国创新力量已然站在了舞台中央。

结语：

“当MiniMax用10秒1080P的动态特效，刷新了我们对‘清晰’与‘真实’的理解；当Midjourney以10美元/月的亲民价格，让视频创作不再是少数人的专利——全球视频生成模型的竞争，早已不再是单纯的技术较量，而是关于‘未来内容如何被创造’的深刻变革。

看看AAVA榜单前十名中七个中国名字，再看看技术指标和商业模式的双重突破：中国力量正以扎实的技术实力和对用户需求的精准把握，重新制定全球AI视频的规则。无论是MiniMax用代码造出以假乱真的物理特效，还是Midjourney用独到美学降低创作门槛，它们都在追问同一个核心：下一代的视频，如何更逼真、更随心所欲、更能打动人？

这场竞争的终点，或许藏在更远的未来图景里：当实时生成互动视频成为日常，当虚拟与现实的界限因物理仿真而模糊，我们终将抵达一个‘想到即看到，看到即触到’的世界。在那里，中国创新早已不是追赶者，而是规则的塑造者和崭新世界的开拓者。”

本文来源于DOIT传媒，文章内容仅供参考，不构成投资建议。