谷歌发布了其最强大的人工智能模型，Gemini 3——以下是您需要了解的内容

谷歌今天在公开预览中发布了Gemini 3 Pro，称其为公司迄今为止最强大的AI模型。该系统能够同时处理文本、图像、音频和视频，同时处理多达100万个上下文标记——大约相当于70万字，或约10本完整的小说。

预览模型可供任何人免费试用这里。

谷歌表示，该模型在几乎所有公司测试的基准上超越了其前身，Gemini 2.5 Pro。在人类最后的考试（一个学术推理测试）中，Gemini 3 Pro的得分为37.5%，而2.5 Pro为21.6%。在ARC-AGI-2，一个视觉推理难题基准中，差距进一步扩大：31.1%对4.9%。

当然，目前AI竞赛的真正挑战并不在于技术，而在于获得商业市场份额。

曾经在搜索领域似乎不可战胜的谷歌，已经向OpenAI让出了大量市场份额，后者声称其每周有约8亿用户使用ChatGPT，而Gemini的用户据报道约有6.5亿月活跃用户。谷歌并未透露其每周用户数量，但这将远低于其月活跃用户数。

尽管如此，Gemini 3的技术成就令人印象深刻。

Gemini 3 Pro使用谷歌所称的稀疏专家混合架构。该系统并不是为每个查询激活所有超过1万亿个参数，而是将每个输入路由到专门的子网络。只有模型的一小部分——在特定任务上的专家——在任何给定时间运行，从而降低计算成本，同时保持性能。

与GPT和Claude等大型密集模型（万事通）不同，谷歌的方法更像是大型组织的运作方式。一个拥有1000名员工的公司不会在每次会议上召集所有人；特定团队处理特定问题。Gemini 3 Pro以相同的方式工作，将问题指向正确的专家网络。

谷歌在网络文档、代码库、图像、音频文件和视频上训练了该模型——以及其他AI系统生成的合成数据。公司对训练数据进行了质量和安全过滤，移除了色情内容、暴力材料和任何违反儿童安全法的内容。训练是在谷歌的张量处理单元上使用JAX和ML Pathways软件进行的。

对该模型的快速测试表明，它非常强大。在我们通常的编码测试中，要求生成一个隐形游戏，这是第一个生成3D游戏而不是2D体验的模型。其他运行提供了2D版本，但所有版本都功能齐全且快速。

这种方法遵循了ChatGPT或Perplexity的风格，通过分享后续问题和建议来鼓励进一步互动，但谷歌的实现更加简洁和有帮助。

在生成代码时，界面提供提示以帮助后续提示，因此用户可以引导模型生成更好的代码，修复错误，并改善应用程序的逻辑、用户界面等。它还为用户提供了部署其代码和基于Gemini的应用程序的选项。

总体而言，该模型似乎特别专注于编码任务。创造力不是它的强项，但通过良好的系统提示和示例，可以很容易地引导它，因为它具有非常大的标记上下文窗口。

Gemini 3的模型卡的存档版本——一份提供有关模型设计、预期用途、性能和局限性的重要信息的文档——由谷歌DeepMind发布，显示Gemini 3 Pro可以生成多达64,000个标记的输出，并保持知识截止日期为2025年1月。谷歌承认该模型可能会出现幻觉，并偶尔会经历缓慢或超时的情况。

目前没有官方的模型卡。

如前所述，谷歌AI工作室目前为所有人提供Gemini 3 Pro的免费访问。Vertex AI和Gemini API也支持该模型。然而，Gemini 3 Pro尚未通过Gemini应用程序提供——即使是付费的Gemini Pro订阅者也无法使用。

11月的发布使谷歌与Anthropic的Claude Sonnet 4.5、Grok 4.1甚至OpenAI的GPT-5.1形成竞争。基准分数表明，Gemini 3 Pro在推理和多模态任务中领先，尽管实际性能因使用案例而异。

谷歌通过其云平台分发Gemini 3 Pro，遵循现有的服务条款。公司的生成性AI禁止使用政策适用，禁止在危险活动、安全漏洞、色情内容、暴力、仇恨言论和虚假信息中使用。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

Decrypt的精選文章