为什么说 Gemma 是最先进的开源模型？

This page is also available in:

在过去的几年里，开源大语言模型（Large Language Models，LLMs）引起了人们的广泛关注，它们可以理解和生成自然语言，执行各种复杂的任务，例如阅读理解、摘要、翻译、对话、数学等。一些知名的开源大语言模型，例如 GPT-3、Llama-2、Mistral 等，都拥有数百亿甚至数万亿的参数，表现出了惊人的能力，但也带来了一些挑战，例如高昂的计算成本、潜在的安全风险、难以获取和使用等。

为了解决这些问题，谷歌推出了一代新的开源模型——Gemma，这些模型是基于谷歌的 Gemini 模型的研究和技术构建的。Gemini 模型是谷歌目前最大、最强大的 AI 模型，它可以理解和生成 101 种语言，拥有 1.6 万亿的参数。Gemma 模型是 Gemini 模型的启发和延续，它的名字来源于拉丁文 gemma，意思是“宝石”。Gemma 模型不仅提供了模型的权重，还提供了一些工具，支持开发者的创新，促进协作，指导模型的负责任的使用。

那么，Gemma 模型有什么优势？为什么说它是最先进的开源模型？让我们一起来了解一下。

首先，Gemma 模型的性能在其尺寸范围内是最优秀的，它们与 Gemini 模型共享了技术和基础设施的组件，这使得它们能够在 18 个语言理解、推理、数学等关键的基准测试中，超越了 Meta Llama-2 等更大参数的开源模型。而且，Gemma 模型可以直接在开发者的笔记本电脑或台式机上运行，无需额外的硬件或云服务。值得注意的是，Gemma 模型在遵守谷歌严格的安全和负责任的标准的同时，还在一些关键的基准测试上超越了明显更大的模型。有关性能、数据集组成和建模方法的详细信息，请参阅技术报告。

其次，Gemma 模型的设计以谷歌的 AI 原则为前提。为了使 Gemma 预训练模型安全可靠，谷歌使用了自动化的技术，从训练集中过滤掉了一些个人信息和其他敏感数据。此外，谷歌还使用了广泛的微调和人类反馈的强化学习（RLHF），使指令调优模型与负责任的行为保持一致。为了理解和降低 Gemma 模型的风险，谷歌进行了强有力的评估，包括手动的红队测试、自动的对抗测试，以及对模型危险活动能力的评估。这些评估都在模型卡片中进行了概述。

最后，Gemma 模型的使用非常方便，谷歌提供了多个主流的框架的工具链，支持推理和监督式微调（SFT），包括 JAX、PyTorch 和 TensorFlow（通过原生的 Keras 3.0）。谷歌还提供了一些易用的 Colab 和 Kaggle 笔记本，以及与一些流行的工具的集成，例如 Hugging Face、MaxText、NVIDIA NeMo 和 TensorRT-LLM，让开发者可以轻松地开始使用 Gemma 模型。谷歌还与 Gemma 模型一起发布了一个新的负责任的生成型 AI 工具包，帮助开发者和研究者优先考虑构建安全和负责任的 AI 应用。该工具包包括：

安全分类：谷歌提供了一种新颖的方法，可以用最少的例子构建强大的安全分类器。
调试：一个模型调试工具可以帮助开发者检查和解决 Gemma 模型的行为和潜在的问题。
指导：开发者可以访问基于谷歌在开发和部署大型语言模型的经验的最佳实践。

截至目前 Gemma 可说是最先进的开源模型，它为开发者提供了一个强大、灵活、可靠的 AI 工具，可以帮助他们负责任地构建 AI 应用，解决各种复杂的问题，创造更好的未来。

如果你有任何疑问欢迎在下方评论区留言讨论。

本文发布于 2024-02-22，最近更新 2024-09-23。

本文版权归 torchtree.com 网站所有，未经授权不可转载。