location_on 首页 keyboard_arrow_right 资讯 keyboard_arrow_right 正文

中国移动发布MoMA大模型聚合平台，接入超300款模型，单位Token成本压降约30%

资讯 2026-05-10 34

5月10号据IT之家报道，中国移动于5月8日在苏州举行的2026移动云大会上正式发布移动模型服务平台MoMA，该平台目前已接入超300款业界主流AI模型，成为国内大模型数量最多的聚合平台之一，并首创Token集约化运营模式，推动AI服务向普惠化方向迈进。

从技术架构来看，MoMA平台基于国产算力部署自研推理引擎，提供统一API网关，已接入中国移动自研“九天”基座大模型，以及DeepSeek、通义千问、豆包、Kimi、GLM等业界优质模型，覆盖文本生成、语音处理、多模态理解等多项能力。平台首创智能路由引擎，可根据需求灵活切换“成本优先”“效果优先”“均衡优先”三种策略，动态匹配最优模型，当模型出现超时、限流或故障时，可实现秒级自动切换，确保业务连续不中断。

在成本控制和安全保障方面，MoMA通过智能路由对长尾模型资源调度，结合智能缓存、上下文复用、Token压缩等技术，实现单位Token成本压降约30%、资源占用率降低50%以上。平台同步推出“机密模型”服务，将模型部署在机密容器中，基于硬件隔离技术覆盖从芯片到应用的全链路机密计算，为政务、金融等数据安全要求较高的场景提供可信支撑。

MoMA的发布标志着中国移动在MaaS（模型即服务）领域实现从“单模型调用”向“平台化运营”的关键升级。该平台覆盖政务、金融、工业、医疗、教育等多类应用场景，有助于降低中小企业和行业用户接入大模型的成本和门槛，加速AI应用在各行业的规模化落地。随着平台模型接入数量持续扩充，中国移动还将开放万亿级Token服务体验包，进一步完善从算力底座到模型服务的全链路能力，推动人工智能更加广泛、高效、安全地服务经济社会发展。

高德ABot体系模型夺冠AGIBot全球挑战赛，空间智能实现具身化跃迁

« 上一篇 2026-05-10

英矽智能与Google Cloud达成战略合作，借Gemini模型加速AI药物发现全流程

下一篇 » 2026-05-10

中国移动发布MoMA大模型聚合平台，接入超300款模型，单位Token成本压降约30%

相关推荐

小卡

内容举报