٩(◕‿◕。)۶ 嗨,探险家!
还没拿到探险许可吗?
加入数字探险
欢迎回到数智世界!
用户名
密码
同意
《用户服务协议》
《隐私政策》
开启
密码掉进黑洞了?
微信公众号
抖音视频
微信视频号
小红书
数智朋克
DIGIPUNK
快讯
智选
创新
探索
欢迎进群
来自
去投稿
开源创新
DeepSeek-V3 是一个突破性的Mixture-of-Experts(MoE)语言模型,拥有6710亿参数,采用创新的多头潜在注意力(MLA)机制和负载平衡策略,在数学推理和编程任务中展现了超凡的性能。
DeepSeek-V3:突破性MoE语言模型,解锁AI新时代
数智本土
猎户星空近日发布的Orion-MoE8×7B大模型,结合生成式混合专家架构,具备多语言处理能力,表现出色。与聚云科技合作推出的AI数据宝平台进一步助力大模型商业化,推动企业AI应用突破。
猎户星空发布Orion-MoE8×7B大模型,推动AI技术与数据服务落地
数智本土
幻方量化旗下AI公司DeepSeek发布全新第二代MoE大模型DeepSeek-V2。该模型性能接近GPT-4Turbo,具备2360亿参数,每token激活210亿参数,支持128K上下文长度,成本显著降低。
DeepSeek发布第二代MoE大模型,性能直逼GPT-4Turbo
数智本土
APUS携手新旦智能,在GitHub上正式开源千亿参数级别的MoE(Mixture of Experts)架构大模型,标志着国内首个此规模的MoE架构模型的诞生。
APUS与新旦智能开源千亿级MoE大模型
DIGIPUNK
AIGC社群
联系我们
加入我们
商务合作
我要投稿
解决方案
媒体矩阵
Copyright © 2023-2024 DIGIPUNK LTD.