要点速达👈
- 🌟 Google开源Gemma 2 2B模型
- 🤖 性能超越所有GPT-3.5模型
- 🔐 同日发布ShieldGemma安全分类模型和Gemma Scope
- ⚡ Gemma 2 2B模型适用于多种设备,性能优化
- 📊 NTIA政策建议强调开放模型权重的重要性
数智朋克讯,Google于7月31日开源了Gemma 2 2B模型,扩展了Gemma 2模型家族。Gemma 2 2B作为最小的成员,通过蒸馏技术从更大的模型中学习,性能超越同类大小的开源模型,并在LMSYS Chatbot Arena Leaderboard上超越所有GPT-3.5模型,展示出强大的对话式AI能力。该模型不仅适用于高端设备,还能灵活部署于边缘设备、笔记本和云计算环境,通过Nvidia TensorRT-LLM函数库优化,以提升速度和性能。
与Gemma 2 2B同时发布的还有安全内容分类模型ShieldGemma,以及用于解释模型内部作业的Gemma Scope。ShieldGemma旨在过滤输入输出端的有害内容,涵盖仇恨言论、骚扰、裸露色情和危险内容,提供2B、9B和27B版本,以满足不同的应用需求。Gemma Scope则由稀疏自动编码器(SAE)组成,帮助研究人员理解模型中的特征演变和相互作用,进一步透明化AI模型的内部作业。
Gemma 2模型家族于今年6月首次发布,包括9B和27B版本,采用与大型语言模型Gemini一致的研究及技术,能够在高端游戏笔记本、台式机和云计算上运行。Gemma 2 2B通过与Nvidia硬件的集成,能够在各种设备上高效执行,并支持Keras、JAX、Hugging Face、Nvidia NeMo、Ollama、Gemma.cpp以及即将支持的MediaPipe,以简化开发流程。
Google的这一系列开源举措展示了其在AI技术上的领先地位,也进一步支持了开发者社区的成长。美国商务部旗下的国家电信暨信息管理局(NTIA)近期发布的政策建议也指出,开放模型权重可以帮助小公司、研究人员、非营利组织和个人更好地利用AI技术,同时强调需要积极监控AI模型的安全风险。