谷歌推出了新的开源AI模型,能与Meta的Llama-2竞争吗?

CN
Decrypt
关注
1年前

Google AI——搜索巨头的一个部门——今天发布了Gemma,这是一组新的开源语言模型,源自其最近发布的Gemini AI工具套件。通过Gemma,Google直接挑战了基于Meta的LLaMa和Mistral的LLM领先地位。

“我们一直支持负责任的开源和科学,这可以推动快速的研究进展,”Google DeepMind联合创始人Demis Hassabis在一条tweet中写道。“因此,我们很自豪地发布了Gemma:一组轻量级的开放模型,以其体积而言是最佳的,灵感来自用于Gemini的相同技术。”

Gemini是最近由Google发布的闭源商业多模式LLMs,用于取代PaLM-2,为其一系列在线服务提供动力,直接与OpenAI的ChatGPT Plus竞争。

Gemma有两个版本可用:Gemma 2B,一个在20亿参数上训练的轻量级模型,经过优化以提高效率,并可在更广泛的硬件范围内运行;Gemma 7B,一个在70亿参数上训练的更强大的模型,提供更好的结果,但需要更多的计算能力。

“在Google,我们相信让AI对每个人都有帮助,”Google在一份官方公告中表示,强调了其民主化AI技术的愿景。

发布开源模型可能会更直接地影响AI开发人员和软件工程师,但在经过测试、微调并构建成产品和服务之后,其好处将传达给最终用户。

“随着我们继续扩展Gemma模型系列,我们期待为不同的应用程序引入新的变体,”公司补充道。

Google的公告涵盖了Gemma的技术和哲学基础,称该模型“是以我们的AI原则为首要考虑因素而设计的。”

“为了了解和降低Gemma模型的风险概况,我们进行了包括手动红队测试、自动对抗测试以及对危险活动的模型能力评估在内的全面评估,”它说。

在发布后不久,Gemma迅速攀升至备受关注的Hugging Face排行榜上,达到了trending list的第二名,并击败了除了Stability AI的Open Cascade之外的所有其他开源LLMs和AI模型。Stability AI的Open Cascade是一种新的文本到图像生成AI。

Gemma声称的实力得到了真实数据的支持:它在几个合成基准测试中表现出优越的性能,超过了Meta的LlaMa-2。例如,Gemma在MMLU(涵盖57个科学学科的知识)、Hellaswag(评估日常任务中的基本推理能力)、MATH(评估数学能力)和HumanEval(测试编码熟练度)等测试中均表现优于LlaMa-2。

图片:Google

对Gemma感兴趣的开发人员可以免费使用Kaggle进行测试,这是Google构建的一个数据科学和人工智能平台。该公司还通过Google Colab笔记本提供了Gemma,并为首次使用Google Cloud的用户提供了300美元的信用额度。

“研究人员还可以申请高达50万美元的Google Cloud信用额度来加速他们的项目,”Google表示。

Ryan Ozawa编辑。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

ad
出入金首选欧易,注册立返20%
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接