٩(◕‿◕。)۶ 嗨,探险家!
还没拿到探险许可吗?
加入数字探险
欢迎回到数智世界!
用户名
密码
同意
《用户服务协议》
《隐私政策》
开启
密码掉进黑洞了?
微信公众号
抖音视频
微信视频号
小红书
数智朋克
DIGIPUNK
快讯
智选
创新
探索
欢迎进群
来自
去投稿
数智本土
浪潮信息推出“源2.0-M32”大模型,采用“基于注意力机制的门控网络”技术,构建32个专家的混合专家模型(MoE),显著提升了算力效率。M32在仅激活37亿参数的情况下,达到了与700亿参数LLaMA3相当的性能,所消耗算力仅为LLaMA3的1/19。
浪潮信息发布“源2.0-M32”开源大模型
数智本土
浪潮信息在北京发布了其最新的基础大模型“源2.0”,并宣布该模型将全面开源。"源2.0"包括102B、51B和2B三种参数规模的模型,这些模型在编程、推理和逻辑方面展现出了先进的能力。通过采用新型注意力算法结构和高质量的数据集,"源2.0"在使用更少的训练算力和更小的模型参数下,实现了更高的模型精度和涌现能力。
浪潮信息发布“源2.0”大模型并宣布全面开源
DIGIPUNK
AIGC社群
联系我们
加入我们
商务合作
我要投稿
解决方案
媒体矩阵
Copyright © 2023-2024 DIGIPUNK LTD.