中国科技巨头阿里巴巴推出新的人工智能视频工具

CN
Decrypt
關注
1 年前

又是一天,又有一个人工智能模型问世了。中国阿里巴巴集团旗下的阿里巴巴云——全球最大的云计算公司之一——推出了其I2VGen-XL AI 工具。这是一种先进的文本到视频系统,旨在与 Pika Labs 或 Stability AI 等顶尖模型竞争。

该公司宣布今天发布了该模型的权重,此前已在上个月发布了该模型的研究论文

研究论文解释说,I2VGen-XL 是使用级联扩散模型构建的,这是一种复杂的人工智能技术,可以确保生成的视频不仅在视觉上令人印象深刻,而且在语境上连贯并且语义准确。它采用两阶段过程:基础阶段专注于保持与输入文本和图像的连贯性,而精化阶段则增强视频的细节和分辨率,达到最高 1280x720 像素。

这种技术听起来可能与用于生成 SDXL 图像的技术类似。与 SD 1.5 和 SD 2.1 依赖单一模型不同,Stability AI 开发了两种不同的模型,一个基础模型和一个精化模型,应该结合使用以生成可能的最高质量图像。

阿里巴巴云表示,该模型的训练使用了大约 3500 万个文本到视频对和惊人的 60 亿个文本到图像对的庞大数据集。这样庞大的数据集确保了模型在各种场景和主题下的多功能性和准确性。

AI 竞赛中的新模型

此次发布正值全球科技格局出现加剧紧张和竞争之际,特别是在美国和中国之间。在贸易限制和推动技术自力更生的背景下,阿里巴巴的举动对于中国来说既及时又具有战略意义。

阿里巴巴的最新创新并非孤立发展,而是科技竞争的长期叙事的一部分。随着美国对芯片出口实施限制,中国则以其反制措施作出回应,AI 霸权之争加速升级。这种环境推动了本土技术的进步,两国都在争夺在人工智能、半导体技术和 5G 创新领域的领先地位。

与该领域的其他显着进展相比,例如Pika Labs 的模型Stable Video Diffusion,I2VGen-XL 通过其独特的方法和高语义准确性脱颖而出。使用 HiGen(一种扩散模型)与 I2VGen-XL 的演示展示了在时间和帧一致性方面与仅使用 HiGen 相比的重大改进。

阿里巴巴的 I2VGen-XL 模型代表了人工智能领域的重要里程碑,因为它为那些对中国用户被禁止或未来可能受到美国或中国政府限制的模型提供了一种替代方案。

阿里巴巴的新兴科技举措

阿里巴巴不仅仅是电子商务的重要参与者。它长期以来一直是新兴技术领域的重要参与者,不断推动人工智能、元宇宙、软件甚至数字货币领域的新发展。

在以人工智能驱动的动画领域,除了 I2VGen-XL,阿里巴巴的"Animate Anyone" 模型也引人注目。该工具将静态图像转换为动态动画,采用了一种称为 ReferenceNet 的新框架。整合复杂的扩散模型实现了时间稳定和视觉一致的视频。

阿里巴巴云还与 Avalanche 合作推出其 Cloudverse 平台。这项技术为企业提供了创建和维护其数字宇宙的无缝路径。与 Avalanche 的战略联盟以及 Metaverse Universal Assets DAO 在中间件解决方案中的参与突显了阿里巴巴的合作方式以及其致力于利用 Web3 技术的决心。

此外,马云对数字货币的见解表明了阿里巴巴对全球金融未来的浓厚兴趣。马云倡导数字货币在建立新金融体系中的变革作用,与金融领域数字化的全球趋势相一致。阿里巴巴 CEO 自称是加密货币的怀疑论者,但这种立场远非加密货币的仇视者,因为阿里巴巴在 2018 年的著名加密寒冬中推出了区块链即服务业务

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

欧易返20%,前100送AiCoin保温杯
链接:https://www.okx.com/zh-hans/join/aicoin20
廣告
分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接