谷歌发布了其最强大的人工智能模型,Gemini 3——以下是您需要了解的内容

CN
Decrypt
關注
3 小時前

谷歌今天在公开预览中发布了Gemini 3 Pro,称其为公司迄今为止最强大的AI模型。该系统能够同时处理文本、图像、音频和视频,同时处理多达100万个上下文标记——大约相当于70万字,或约10本完整的小说。

预览模型可供任何人免费试用这里

谷歌表示,该模型在几乎所有公司测试的基准上超越了其前身,Gemini 2.5 Pro。在人类最后的考试(一个学术推理测试)中,Gemini 3 Pro的得分为37.5%,而2.5 Pro为21.6%。在ARC-AGI-2,一个视觉推理难题基准中,差距进一步扩大:31.1%对4.9%。

当然,目前AI竞赛的真正挑战并不在于技术,而在于获得商业市场份额。

曾经在搜索领域似乎不可战胜的谷歌,已经向OpenAI让出了大量市场份额,后者声称其每周有约8亿用户使用ChatGPT,而Gemini的用户据报道约有6.5亿月活跃用户。谷歌并未透露其每周用户数量,但这将远低于其月活跃用户数。

尽管如此,Gemini 3的技术成就令人印象深刻。

Gemini 3 Pro使用谷歌所称的稀疏专家混合架构。该系统并不是为每个查询激活所有超过1万亿个参数,而是将每个输入路由到专门的子网络。只有模型的一小部分——在特定任务上的专家——在任何给定时间运行,从而降低计算成本,同时保持性能。

与GPT和Claude等大型密集模型(万事通)不同,谷歌的方法更像是大型组织的运作方式。一个拥有1000名员工的公司不会在每次会议上召集所有人;特定团队处理特定问题。Gemini 3 Pro以相同的方式工作,将问题指向正确的专家网络。

谷歌在网络文档、代码库、图像、音频文件和视频上训练了该模型——以及其他AI系统生成的合成数据。公司对训练数据进行了质量和安全过滤,移除了色情内容、暴力材料和任何违反儿童安全法的内容。训练是在谷歌的张量处理单元上使用JAX和ML Pathways软件进行的。

对该模型的快速测试表明,它非常强大。在我们通常的编码测试中,要求生成一个隐形游戏,这是第一个生成3D游戏而不是2D体验的模型。其他运行提供了2D版本,但所有版本都功能齐全且快速。

这种方法遵循了ChatGPT或Perplexity的风格,通过分享后续问题和建议来鼓励进一步互动,但谷歌的实现更加简洁和有帮助。

在生成代码时,界面提供提示以帮助后续提示,因此用户可以引导模型生成更好的代码,修复错误,并改善应用程序的逻辑、用户界面等。它还为用户提供了部署其代码和基于Gemini的应用程序的选项。

总体而言,该模型似乎特别专注于编码任务。创造力不是它的强项,但通过良好的系统提示和示例,可以很容易地引导它,因为它具有非常大的标记上下文窗口。

Gemini 3的模型卡的存档版本——一份提供有关模型设计、预期用途、性能和局限性的重要信息的文档——由谷歌DeepMind发布,显示Gemini 3 Pro可以生成多达64,000个标记的输出,并保持知识截止日期为2025年1月。谷歌承认该模型可能会出现幻觉,并偶尔会经历缓慢或超时的情况。

目前没有官方的模型卡。

如前所述,谷歌AI工作室目前为所有人提供Gemini 3 Pro的免费访问。Vertex AI和Gemini API也支持该模型。然而,Gemini 3 Pro尚未通过Gemini应用程序提供——即使是付费的Gemini Pro订阅者也无法使用。

11月的发布使谷歌与Anthropic的Claude Sonnet 4.5、Grok 4.1甚至OpenAI的GPT-5.1形成竞争。基准分数表明,Gemini 3 Pro在推理和多模态任务中领先,尽管实际性能因使用案例而异。

谷歌通过其云平台分发Gemini 3 Pro,遵循现有的服务条款。公司的生成性AI禁止使用政策适用,禁止在危险活动、安全漏洞、色情内容、暴力、仇恨言论和虚假信息中使用。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接