
6月19日,AI初创公司Midjourney继推出图片生成服务之后,发表了首个视频模型V1,利用图像生成视频,费用是生成图片价格的8倍。
Midjourney表示,公司目标是构建一个可实时模拟开放世界的模型。想象一个可实时生成视频的AI系统,支持用户命令它在3D空间移动,环境及角色也会跟着移动彼此形成互动。为了达到这个目标,Midjourney要建立各种模块,比如图片模型,让图片动作的视频模型,以及能在空间中移动的3D模型,还有能快速完成所有操作的实时模型。
明年起,Midjourney将这些元件整合成一个统一的系统,一开始可能比较贵,但很快就会变得经济实惠,让每个人都能使用。
V1是Midjourney所推出的第一个影片模型,它的工作流程基本上是图片转视频(Image-to-Video),一开始还是制作或上传图像,成为影像的第一帧图,再按下“Animate”运行。使用者可以选择自动或是手动,前者是由系统决定动作,后者允许使用者描述物体的移动方式与场景的变化。
使用者还可以选择低速(low motion)或高速(high motion)运动,前者代表主体的行动是缓慢的,后者则会让所有物件都动起来,不过这样容易出现一些错误。
根据Midjourney的视频模型说明文件,V1基本会生成一个5秒、分辨率为480p的影片,之后可以选择延长影片,每次延长时间为4秒,最多可延长4次,代表可建立最长21秒的影片。
现阶段Midjourney并未提供免费额度,目前提供4种订阅方案,都可生成图或视频,每个方案的额度计算方式为快速GPU时间(Fast GPU Time),最便宜的是每月10美元的基本方案(Basic Plan),Fast GPU Time额度为每月200分钟。除了基本方案之外的3种相对高阶方案,都有提供放松GPU时间(Relax GPU Time),它的生成速度较慢,可能需要排队,但不消耗额度,还可以无限使用。
Midjourney表示,用户生成一个影片的成本约是图像的8倍,但这是市场上其他视频生成服务的1/25。
不过图片生成也为Midjourney带来一些不可避免的麻烦,目前迪士尼和环球影业都在指控Midjourney利用其动画角色训练模型,允许使用者生成基于相同角色的图像,还拿这些生成作品来营利,严重且故意侵害其著作权。看来以后生成的图片版权问题也要注意了。