Google开源Gemma 2 2B模型，超越GPT-3.5性能

要点速达👈

🌟 Google开源Gemma 2 2B模型
🤖 性能超越所有GPT-3.5模型
🔐 同日发布ShieldGemma安全分类模型和Gemma Scope
⚡ Gemma 2 2B模型适用于多种设备，性能优化
📊 NTIA政策建议强调开放模型权重的重要性

数智朋克讯，Google于7月31日开源了Gemma 2 2B模型，扩展了Gemma 2模型家族。Gemma 2 2B作为最小的成员，通过蒸馏技术从更大的模型中学习，性能超越同类大小的开源模型，并在LMSYS Chatbot Arena Leaderboard上超越所有GPT-3.5模型，展示出强大的对话式AI能力。该模型不仅适用于高端设备，还能灵活部署于边缘设备、笔记本和云计算环境，通过Nvidia TensorRT-LLM函数库优化，以提升速度和性能。

与Gemma 2 2B同时发布的还有安全内容分类模型ShieldGemma，以及用于解释模型内部作业的Gemma Scope。ShieldGemma旨在过滤输入输出端的有害内容，涵盖仇恨言论、骚扰、裸露色情和危险内容，提供2B、9B和27B版本，以满足不同的应用需求。Gemma Scope则由稀疏自动编码器（SAE）组成，帮助研究人员理解模型中的特征演变和相互作用，进一步透明化AI模型的内部作业。

Gemma 2模型家族于今年6月首次发布，包括9B和27B版本，采用与大型语言模型Gemini一致的研究及技术，能够在高端游戏笔记本、台式机和云计算上运行。Gemma 2 2B通过与Nvidia硬件的集成，能够在各种设备上高效执行，并支持Keras、JAX、Hugging Face、Nvidia NeMo、Ollama、Gemma.cpp以及即将支持的MediaPipe，以简化开发流程。

Google的这一系列开源举措展示了其在AI技术上的领先地位，也进一步支持了开发者社区的成长。美国商务部旗下的国家电信暨信息管理局（NTIA）近期发布的政策建议也指出，开放模型权重可以帮助小公司、研究人员、非营利组织和个人更好地利用AI技术，同时强调需要积极监控AI模型的安全风险。

Google开源Gemma 2 2B模型，超越GPT-3.5性能

数智资讯订阅