This page is also available in:
在过去的几年里,开源大语言模型(Large Language Models,LLMs)引起了人们的广泛关注,它们可以理解和生成自然语言,执行各种复杂的任务,例如阅读理解、摘要、翻译、对话、数学等。一些知名的开源大语言模型,例如 GPT-3、Llama-2、Mistral 等,都拥有数百亿甚至数万亿的参数,表现出了惊人的能力,但也带来了一些挑战,例如高昂的计算成本、潜在的安全风险、难以获取和使用等。
为了解决这些问题,谷歌推出了一代新的开源模型——Gemma,这些模型是基于谷歌的 Gemini 模型的研究和技术构建的。Gemini 模型是谷歌目前最大、最强大的 AI 模型,它可以理解和生成 101 种语言,拥有 1.6 万亿的参数。Gemma 模型是 Gemini 模型的启发和延续,它的名字来源于拉丁文 gemma,意思是“宝石”。Gemma 模型不仅提供了模型的权重,还提供了一些工具,支持开发者的创新,促进协作,指导模型的负责任的使用。
那么,Gemma 模型有什么优势?为什么说它是最先进的开源模型?让我们一起来了解一下。
首先,Gemma 模型的性能在其尺寸范围内是最优秀的,它们与 Gemini 模型共享了技术和基础设施的组件,这使得它们能够在 18 个语言理解、推理、数学等关键的基准测试中,超越了 Meta Llama-2 等更大参数的开源模型。而且,Gemma 模型可以直接在开发者的笔记本电脑或台式机上运行,无需额外的硬件或云服务。值得注意的是,Gemma 模型在遵守谷歌严格的安全和负责任的标准的同时,还在一些关键的基准测试上超越了明显更大的模型。有关性能、数据集组成和建模方法的详细信息,请参阅技术报告。
其次,Gemma 模型的设计以谷歌的 AI 原则为前提。为了使 Gemma 预训练模型安全可靠,谷歌使用了自动化的技术,从训练集中过滤掉了一些个人信息和其他敏感数据。此外,谷歌还使用了广泛的微调和人类反馈的强化学习(RLHF),使指令调优模型与负责任的行为保持一致。为了理解和降低 Gemma 模型的风险,谷歌进行了强有力的评估,包括手动的红队测试、自动的对抗测试,以及对模型危险活动能力的评估。这些评估都在模型卡片中进行了概述。
最后,Gemma 模型的使用非常方便,谷歌提供了多个主流的框架的工具链,支持推理和监督式微调(SFT),包括 JAX、PyTorch 和 TensorFlow(通过原生的 Keras 3.0)。谷歌还提供了一些易用的 Colab 和 Kaggle 笔记本,以及与一些流行的工具的集成,例如 Hugging Face、MaxText、NVIDIA NeMo 和 TensorRT-LLM,让开发者可以轻松地开始使用 Gemma 模型。谷歌还与 Gemma 模型一起发布了一个新的负责任的生成型 AI 工具包,帮助开发者和研究者优先考虑构建安全和负责任的 AI 应用。该工具包包括:
截至目前 Gemma 可说是最先进的开源模型,它为开发者提供了一个强大、灵活、可靠的 AI 工具,可以帮助他们负责任地构建 AI 应用,解决各种复杂的问题,创造更好的未来。
如果你有任何疑问欢迎在下方评论区留言讨论。
本文发布于 2024-02-22,最近更新 2024-09-23。
本文版权归 torchtree.com 网站所有,未经授权不可转载。