OpenAI发布Sora 2,推出了一款TikTok风格的社交应用,让你出现在视频中。

CN
Decrypt
关注
3小时前

OpenAI于周二发布了Sora 2,将其最新的视频生成模型与一款新的社交应用结合在一起,让用户能够创建、分享和参与AI生成的短片。该公司称此次发布是模拟物理现实的重要一步,模型首次能够生成与视频同步的音频。

更新后的模型能够生成展示复杂物理互动的视频片段,而早期系统对此感到困难。在一些示例中,Sora生成了奥林匹克体操动作、在划水板上的后空翻,以及角色执行三周跳而没有明显的扭曲或变形。与之前那些为了满足文本提示而扭曲物理规律的视频生成器不同,Sora 2试图模拟现实的结果,包括失败。

“之前的视频模型过于乐观——它们会扭曲物体和变形现实,以成功执行文本提示,”OpenAI在其公告中表示。Sora 2“在遵循物理法则方面比之前的系统更好。”

该模型直接从文本提示生成背景音景、语音和音效。到目前为止,唯一具备该能力的模型是谷歌的Veo 3。该系统还处理多镜头序列,同时在场景变化中保持连续性,这也非常复杂,需要对角色和环境有深刻的理解。

OpenAI将Sora 2称为“视频的GPT-3.5时刻”,将其与ChatGPT之前的语言模型进行比较。最初的Sora于2024年2月发布,代表了该公司所称的“GPT-1时刻”——视频生成开始大规模运作的第一迹象。

许多更好的模型迅速将Sora甩在了身后,以至于当OpenAI决定发布其模型时,中国的替代品已经能够使用相同的提示生成更好、更连贯的视频

目前,测试该模型的唯一方式是通过新的iOS应用程序简单命名为Sora进行邀请。与之前只能通过网站访问并专注于孤立视频生成的模型不同,该应用程序似乎更加精致和多功能,引入了一项名为“客串”的功能,让用户可以将自己插入生成的场景中。

在录制短视频以验证身份并捕捉外貌和声音后,用户可以出现在任何Sora创建的环境中。该功能适用于人类、动物或物体,用户可以控制谁可以使用他们的肖像。

在演示过程中,OpenAI团队生成了他们自己的视频,展示广告、做踢翻,并在不同场景中出现,风格类似于TikTok视频或Instagram短视频。

该应用程序包括一个可定制的动态,使用OpenAI所描述的新类推荐算法,接受自然语言指令。系统默认显示用户关注或互动的人的内容,公司表示不优化滚动时间。内置机制定期询问用户的幸福感,并提供调整动态设置的选项。

对于青少年,该应用程序默认限制每日在动态中可见的生成数量,并对客串权限进行更严格的限制。家长可以通过ChatGPT访问控制,管理滚动限制、算法个性化和直接消息设置。

用户将完全控制他们的客串,可以随时撤销访问权限或删除包含他们肖像的视频。该应用程序向用户展示所有包含他们客串的视频,包括尚未发布的其他人创建的草稿。

Sora 2将在美国和加拿大通过邀请制系统推出,并计划迅速扩展到其他国家。该服务将是免费的,OpenAI称之为“慷慨的限制”,尽管这些仍然受到计算资源的限制。ChatGPT Pro订阅者可以访问一个名为Sora 2 Pro的实验性高质量版本。该公司计划通过其API发布Sora 2,并将继续提供早期的Sora 1 Turbo模型。

OpenAI表示,Sora 2最终将为用户提供支付额外生成的选项,如果需求超过可用计算资源。

目前,如果您没有邀请代码、iPhone或ChatGPT Pro,唯一的选择是使用有限的Veo 3运行或使用本地视频生成器如Wan。还有像Kling、Seedance、Hailuo或Runway等更便宜的选项,但拥有一个高度真实的视频模型与社交媒体功能的吸引力无疑是行业内其他人无法提供的优势。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接