对话后摩智能CEO吴强:未来90%的数据处理可能会在端边
今年的世界人工智能大会(WAIC 2025),国产算力芯片的发展仍然备受关注。
作为主打端边大模型和存算一体的芯片企业,后摩智能这次带来的M50芯片专为大模型推理设计,主要面向AI PC(人工智能个人电脑)、智能终端等场景。
“未来大模型有两个重要发展趋势:一是大模型的重心逐渐从训练向推理迁移。二是逐渐从云端智能逐渐向边端或者端边智能迁移。”7月25日,后摩智能CEO(首席执行官)吴强对观察者网等表示。
M50芯片被视为后摩智能过去两年交出的一份答卷。
据介绍,M50芯片实现了160TOPS INT8、100TFLOPS bFP16的物理算力,搭配最大48GB内存与153.6 GB/s的超高带宽,典型功耗仅10W,相当于手机快充的功率,能让PC、智能语音设备、机器人等智能移动终端高效运行1.5B到70B参数的本地大模型,实现了“高算力、低功耗、即插即用”。
除了M50芯片,后摩智能此次发布的产品矩阵形成了覆盖端侧到边缘的多元算力方案。力擎LQ50 Duo M.2卡以口香糖大小的标准M.2规格,为AI PC、陪伴机器人等移动终端提供“即插即用”的端侧AI能力。
吴强曾表示,国产替代的企业可以对标海外的某类产品,但绝不能用同样的技术路径进行照搬,如英伟达、AMD等国际巨头的研发、工程、供应链能力远超过初创企业,硬碰硬难以取得成功,创业公司需要另辟蹊径,以一种差异化的技术路线来应对和巨头们之间的竞争。
吴强称,M50芯片的发布是后摩智能现阶段迈出的重要的一步,后面会推出更多的芯片去解决端边大模型的算力和功耗问题以及带宽问题。“长期来说,后摩希望定位在端边AI计算。”
图源:观察者网
“无论是商业还是个人,端边的AI都有可能成为更懂你的AI。因为它本身是有很多天生的优势,尽管刚刚开始,大模型刚刚开始,端边刚刚开始,但是它本身有更好的实时响应,更低的使用成本,更安全的数据隐私,以及更好的个人的用户体验。未来这会成为一个趋势。”吴强说。
2024年初,后摩智能把第一代芯片调整了一版,推出了M30,针对大模型做了一些调整和优化。
吴强还提到,机器人包括具身智能机器人(特指陪伴机器人),更像是十年前的智能驾驶,是一个新兴的垂直赛道,格局还未定,“大家还有机会”。
“只要是端边,只要对大模型有需要,对功耗敏感,都有可能是我们的客户,需要我们逐步地拓展。目前大方向是消费终端、智能办公、智能工业,机器人也算其中,这是我们重点在布局的几个领域。”他表示。
面向未来,后摩智能已启动下一代DRAM-PIM技术研发,通过将计算单元直接嵌入DRAM阵列,使计算与存储的协同更加紧密高效。该技术将突破1TB/s片内带宽,能效较现有水平再提升三倍,推动百亿参数大模型在终端设备实现普及,让更强大的AI算力能够融入PC、平板等日常设备。
本文系观察者网独家稿件,未经授权,不得转载。
2、尝鲜《明末》之后,《黑神话》的含金量还在提升,黑神话2022
3、通讯丨解决罕见难题 助力中非基建合作——记中企承建刚果(布)黑角港东部码头扩建项目