微软通过“重金属四重奏”编译器提高了人工智能的效率

CN
Decrypt
關注
2 年前

微软推出了一套全新的人工智能编译器套件,旨在优化各种人工智能模型的性能。这组“重金属四重奏”先进的编译工具分别命名为 Rammer、Roller、Welder 和 Grinder。

这些工具是由微软研究部门与多所学术机构合作开发的。它们为编译提供了先进的解决方案,基本上是将源代码(人类可读)转换为机器代码(一堆由 0 和 1 组成的内容,使计算机可执行),并在硬件加速器(如 GPU)上更高效地运行主流人工智能模型。

在一篇微软研究博客文章中,公司表示这些编译器是基于微软在人工智能领域的广泛研究和开发基础上构建的。

“我们开发的人工智能编译器已经在人工智能编译效率方面取得了显著的改进,从而促进了人工智能模型的训练和部署。”微软亚洲研究院首席研究员薛继龙写道。“未来,这些大规模模型本身可能会在优化和编译方面发挥作用。”

这四个新编译器分别解决了优化人工智能工作负载中的不同挑战。

Rammer 专注于最大化硬件并行性——即硬件同时执行不同任务的能力。这是性能的关键因素,Rammer 通过改进并行资源的利用来最小化运行时调度开销。

Roller 采用不同的方法来加速编译,使用快速构建算法来寻找解决方案,最终在几秒钟内生成优化的内核,而不是几小时。换句话说,Roller 通过简化设计过程,帮助更快地创建高效的人工智能计算程序。

Welder 通过将运算符连接到集中的管道中,减少昂贵的内存访问流量。它将内存优化统一到一个框架中,以提高效率。

最后,Grinder 通过将控制流执行与数据流集成,实现在控制流边界上的优化。可以将其想象成一位专家指导学徒,告诉他们如何更快地完成工作。

作为领先的科技巨头之一,微软一直处于人工智能进步的最前沿。该公司与人工智能研究公司 OpenAI 密切合作,共同开发了像 GPT-3.5 和 GPT-4 这样的大型语言模型,为 ChatGPT 和必应聊天提供动力。最近,微软还与 Meta 合作,将 LLaMA-2 集成到其云计算解决方案中,并引入了一种名为 Algorithm of Thoughts 的技术,以增强 ChatGPT 等模型的推理能力。

测试发现,这些编译器在基准测试中明显优于现有解决方案。Rammer 在 GPU 上的性能超过其他编译器多达 20 倍。Roller 在降低编译时间的同时,达到或超过了最先进的性能水平。Welder 在 GPU 上的性能超过 PyTorch 等框架多达 21 倍。Grinder 在控制流模型上的加速效果高达 8 倍。

重金属四重奏展示了微软在设计突破性人工智能系统方面的持续领先地位,也展现了微软为其产品取一个有趣的名字的能力。虽然像与 OpenAI 这样的人工智能领域的大型合作伙伴关系抢占头条,但微软也在幕后积极开发重要的软件基础设施,以赋予人工智能更强大的能力。

在现有解决方案的性能方面取得了可观的提升,Rammer、Roller、Welder 和 Grinder 可能在更复杂的人工智能工作负载出现时提供关键的竞争优势。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接