DIGIPUNK
去投稿
发表于:2024年08月02日

Google开源Gemma 2 2B模型,超越GPT-3.5性能

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
要点速达👈
  • 🌟 Google开源Gemma 2 2B模型
  • 🤖 性能超越所有GPT-3.5模型
  • 🔐 同日发布ShieldGemma安全分类模型和Gemma Scope
  • ⚡ Gemma 2 2B模型适用于多种设备,性能优化
  • 📊 NTIA政策建议强调开放模型权重的重要性

数智朋克讯,Google于7月31日开源了Gemma 2 2B模型,扩展了Gemma 2模型家族。Gemma 2 2B作为最小的成员,通过蒸馏技术从更大的模型中学习,性能超越同类大小的开源模型,并在LMSYS Chatbot Arena Leaderboard上超越所有GPT-3.5模型,展示出强大的对话式AI能力。该模型不仅适用于高端设备,还能灵活部署于边缘设备、笔记本和云计算环境,通过Nvidia TensorRT-LLM函数库优化,以提升速度和性能。

与Gemma 2 2B同时发布的还有安全内容分类模型ShieldGemma,以及用于解释模型内部作业的Gemma Scope。ShieldGemma旨在过滤输入输出端的有害内容,涵盖仇恨言论、骚扰、裸露色情和危险内容,提供2B、9B和27B版本,以满足不同的应用需求。Gemma Scope则由稀疏自动编码器(SAE)组成,帮助研究人员理解模型中的特征演变和相互作用,进一步透明化AI模型的内部作业。

Gemma 2模型家族于今年6月首次发布,包括9B和27B版本,采用与大型语言模型Gemini一致的研究及技术,能够在高端游戏笔记本、台式机和云计算上运行。Gemma 2 2B通过与Nvidia硬件的集成,能够在各种设备上高效执行,并支持Keras、JAX、Hugging Face、Nvidia NeMo、Ollama、Gemma.cpp以及即将支持的MediaPipe,以简化开发流程。

Google的这一系列开源举措展示了其在AI技术上的领先地位,也进一步支持了开发者社区的成长。美国商务部旗下的国家电信暨信息管理局(NTIA)近期发布的政策建议也指出,开放模型权重可以帮助小公司、研究人员、非营利组织和个人更好地利用AI技术,同时强调需要积极监控AI模型的安全风险。

本文链接: https://www.shuzhipunk.com/articles/dJOBDL9UqE9
转载请注明文章出处

文章所属标签
Google
Gemma 2 2B
GPT-3.5