后摩智能发布高性能低功耗边端大模型AI芯片后摩漫界™️M30

后摩智能近日发布了其最新的边端大模型AI芯片——后摩漫界™️M30。该芯片采用存算一体架构，提供高达100TOPS的算力，典型功耗仅为12W，旨在满足边端设备对高性能和低功耗的严苛需求。为了增强部署的灵活性，后摩智能还推出了基于M30芯片的智算模组(SoM)和力谋®️AI加速卡。

随着AI大模型应用逐渐从云端向边端设备迁移，AI芯片需要在性能、功耗和响应速度方面提供突破性表现。后摩漫界™️M30芯片在这三个方面都表现出色，能够满足实时性和高效性的要求。其通用性允许支持多种大模型，例如ChatGLM、Llama2和通义千问等。在运行Qwen1.5-7B-Chat模型时，M30的性能可达每秒15-20个Tokens。

基于M30芯片的智算模组(SoM)支持PCIe EP模式，具备小巧体积、高性能和低功耗特点，非常适合用于小型化设备和对功耗敏感的嵌入式场景。而力谋®️AI加速卡作为标准的半高半长PCIe加速卡，能够快速部署在PC、一体机和服务器中，并支持主动和被动散热，确保不同环境下的稳定运行。

后摩漫界™️M30芯片通过“+AI”模式，为传统端侧和边缘设备注入强大的大模型能力，兼容X86和ARM等主流处理器。其应用领域广泛，包括AI PC、智能座舱、商用显示、智能融合网关和NAS等，为AI技术的深入应用提供强大支持。

后摩智能发布高性能低功耗边端大模型AI芯片后摩漫界™️M30

数智资讯订阅