DIGIPUNK
去投稿
发表于:2024年06月28日

后摩智能发布高性能低功耗边端大模型AI芯片后摩漫界™️M30

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿

后摩智能近日发布了其最新的边端大模型AI芯片——后摩漫界™️M30。该芯片采用存算一体架构,提供高达100TOPS的算力,典型功耗仅为12W,旨在满足边端设备对高性能和低功耗的严苛需求。为了增强部署的灵活性,后摩智能还推出了基于M30芯片的智算模组(SoM)和力谋®️AI加速卡。

随着AI大模型应用逐渐从云端向边端设备迁移,AI芯片需要在性能、功耗和响应速度方面提供突破性表现。后摩漫界™️M30芯片在这三个方面都表现出色,能够满足实时性和高效性的要求。其通用性允许支持多种大模型,例如ChatGLM、Llama2和通义千问等。在运行Qwen1.5-7B-Chat模型时,M30的性能可达每秒15-20个Tokens。

基于M30芯片的智算模组(SoM)支持PCIe EP模式,具备小巧体积、高性能和低功耗特点,非常适合用于小型化设备和对功耗敏感的嵌入式场景。而力谋®️AI加速卡作为标准的半高半长PCIe加速卡,能够快速部署在PC、一体机和服务器中,并支持主动和被动散热,确保不同环境下的稳定运行。

后摩漫界™️M30芯片通过“+AI”模式,为传统端侧和边缘设备注入强大的大模型能力,兼容X86和ARM等主流处理器。其应用领域广泛,包括AI PC、智能座舱、商用显示、智能融合网关和NAS等,为AI技术的深入应用提供强大支持。

本文链接: https://www.shuzhipunk.com/articles/JVQddHkPDI4
转载请注明文章出处

文章所属标签
AI大模型
智算模组
后摩漫界™️M30