Runway的新一代AI视频生成器备受赞誉

CN
Decrypt
關注
1 年前

Runway,这家以其知名的生成视频工具而闻名的AI公司,已经推出了其最新版本Runway Gen-3。这个新模型仍处于alpha阶段,尚未公开发布,通过一系列样本视频展示了与目前可用的Gen-2相比在连贯性、逼真度和及时性上的显著进步。

生成的视频,特别是那些展示人脸的视频,非常逼真——以至于AI艺术社区的成员们迅速将其与OpenAI尚未发布但备受期待的Sora进行了有利的比较。

“即使这些是精心挑选的,它们看起来已经比Sora好了,” 一位Reddit用户在Runway Gen-3讨论帖中的最受欢迎的评论中写道。“Sora有一种风格化的外观和感觉,”另一位用户回复道,“这些人看起来实际上是真实的,这是我迄今为止见过的最好的。”

“如果你把这些生成的人展示给我,我会以为它是真实的,” AI视频子论坛的另一条评论写道。


图片:Runway AI

“这些Runway GEN-3片段真的很吸引人——它们看起来很电影化,” 匿名的AI电影制作人PZF在推特上写道,他还自称是Runway的创意合作伙伴。“流畅、低调(以一种好的、自然的方式),可信。”

除了Gen-3视频生成器,Runway还推出了一套精细调整工具,包括更灵活的图像和摄像机控制。

“Gen-3 Alpha将为Runway的文本到视频、图像到视频和文本到图像工具提供动力,现有的控制模式,如Motion Brush、高级摄像机控制和导演模式,以及即将推出的工具,以实现对结构、风格和动作的更精细控制,” 公司在推特上表示。

Runway声称,Gen-3是实现他们雄心勃勃的“通用世界模型”目标的重要一步。这些模型将使AI系统建立对环境的内部表示,并用它来模拟该环境内的未来事件。这种方法将使Runway与侧重于预测特定时间线中下一个可能帧的传统技术有所不同。

尽管Runway尚未透露Gen-3的具体发布日期,联合创始人兼CTO Anastasis Germanidis宣布,Gen-3 Alpha“将很快在Runway产品中推出”。这包括现有模式,以及“一些新模式,这些新模式只有在有了更强大的基础模型之后才有可能,” 他透露道。

Runway在人工智能领域的征程始于2021年,当时他们与慕尼黑大学的研究人员合作建立了稳定扩散的第一个版本。后来,Stability AI介入以抵消项目的计算成本,并将其变成了一个全球现象。

从那时起,Runway一直是人工智能视频生成领域的重要参与者,与Pika Labs等竞争对手并驾齐驱。然而,随着OpenAI宣布推出Sora,情况发生了变化,Sora超越了现有模型的能力。好莱坞演员阿什顿·库彻最近引起轰动,当他说像Sora这样的工具可能会大规模颠覆电视和电影制作时。

然而,尽管世界在等待Sora的公开发布,新的竞争对手已经出现,比如快手的Kling和Luma AI的Dream Machine。Kling是一款中国视频生成器,可以以每秒30帧的1080p分辨率生成长达两分钟的视频,这是对现有模型的实质性改进。这款中国模型已经可用,但用户需要提供中国手机号码。快手表示将发布全球版本。

另一方面,Dream Machine是一个免费平台,可以将书面文本转换为动态视频,并在质量、连贯性和及时性方面轻松击败Runway Gen-2。它需要一个基本的Google账户,但它非常受欢迎,生成时间非常长,甚至可能根本不会出现。

在开源领域,稳定视频扩散虽然无法产生可比较的结果,但为改进和发展提供了坚实的基础。另一款中国人工智能视频生成器Vidu由盛数科技和清华大学开发,使用了一种名为通用视觉变换器(U-ViT)的专有视觉转换模型架构,可以一键生成1080p分辨率的16秒视频。

至于Pika Labs,它尚未发布重大更新,使其能力与Runway Gen-2相媲美。

Decrypt联系了Runway以获取有关发布日期和其他详细信息的进一步信息,但截至目前尚未收到回复。

Ryan Ozawa编辑。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

ad
出入金首选欧易,注册立返20%
廣告
分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接