中国移动发布MoMA大模型聚合平台,接入超300款模型,单位Token成本压降约30%
5月10号据IT之家报道,中国移动于5月8日在苏州举行的2026移动云大会上正式发布移动模型服务平台MoMA,该平台目前已接入超300款业界主流AI模型,成为国内大模型数量最多的聚合平台之一,并首创Token集约化运营模式,推动AI服务向普惠化方向迈进。
从技术架构来看,MoMA平台基于国产算力部署自研推理引擎,提供统一API网关,已接入中国移动自研“九天”基座大模型,以及DeepSeek、通义千问、豆包、Kimi、GLM等业界优质模型,覆盖文本生成、语音处理、多模态理解等多项能力。平台首创智能路由引擎,可根据需求灵活切换“成本优先”“效果优先”“均衡优先”三种策略,动态匹配最优模型,当模型出现超时、限流或故障时,可实现秒级自动切换,确保业务连续不中断。
在成本控制和安全保障方面,MoMA通过智能路由对长尾模型资源调度,结合智能缓存、上下文复用、Token压缩等技术,实现单位Token成本压降约30%、资源占用率降低50%以上。平台同步推出“机密模型”服务,将模型部署在机密容器中,基于硬件隔离技术覆盖从芯片到应用的全链路机密计算,为政务、金融等数据安全要求较高的场景提供可信支撑。
MoMA的发布标志着中国移动在MaaS(模型即服务)领域实现从“单模型调用”向“平台化运营”的关键升级。该平台覆盖政务、金融、工业、医疗、教育等多类应用场景,有助于降低中小企业和行业用户接入大模型的成本和门槛,加速AI应用在各行业的规模化落地。随着平台模型接入数量持续扩充,中国移动还将开放万亿级Token服务体验包,进一步完善从算力底座到模型服务的全链路能力,推动人工智能更加广泛、高效、安全地服务经济社会发展。
高德ABot体系模型夺冠AGIBot全球挑战赛,空间智能实现具身化跃迁
« 上一篇
2026-05-10
英矽智能与Google Cloud达成战略合作,借Gemini模型加速AI药物发现全流程
下一篇 »
2026-05-10