5月27日,小米技术发布公告,宣布对其自研大模型MiMo-V2.5系列API实施永久降价,最高降幅达99%,同时全面优化计费体系。这也是继DeepSeek之后,又一家宣布API永久降价的大模型公司。
此次调价于北京时间2026年5月27日0:00正式生效,全球同步调整。
此次的最大变化是取消了传统定价中区分上下文窗口长度的做法,还对Token Plan计费体系进行优化:在同等付费价格下,Token用量可提升至原来的5至8倍。

▲2026年4月24日,小米MiMo-V2.5系列大模型正式发布 图据视觉中国
本次调价主要聚焦MiMo-V2.5核心系列
从具体定价与降幅细节来看,MiMo-V2.5-Pro调价后输入缓存命中价格仅0.025元/百万tokens,相较于原价≤256k规格1.40元降幅达98%,对比256k-1M规格2.80元降幅更是触及99%;输入未命中缓存定价3.000元/百万tokens,较原价7.00元下降57%,对比长窗口原价14.00元降幅79%;输出定价6元/百万tokens,相较原价21元、42元分别下降71%与86%。

标准版MiMo-V2.5降价力度同样不小,输入缓存命中调价后为0.020元/百万tokens,较≤256k原价0.56元降幅96%,较256k-1M原价1.12元降幅98%;输入未命中缓存定价1.000元/百万tokens,相比原价2.80元降幅64%,对比长窗口原价5.60元降幅82%;输出定价2元/百万tokens,较原价14元、28元分别下滑86%与93%。
值得注意的是,本次调价主要聚焦MiMo-V2.5核心系列,MiMo-V2.5-TTS系列依旧保持限时免费接入政策,而MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型API价格维持原价不变,同时其Token Plan套餐也不再参与调整并即将下线,引导开发者向高性价比的V2.5系列迁移。
雷军:未来三年在AI领域投入600亿元
5月27日凌晨,小米创办人、董事长兼CEO雷军微博转发@小米技术关于API降价的文章表示:今天凌晨,MiMo-V2.5系列做了一次大幅度的价格调整,最高降幅达到99%,不再区分上下文窗口。欢迎更多开发者接入Xiaomi MiMo大模型。

降价消息前一天晚间,小米集团发布一季度业绩:总收入991.42亿元,同比下滑10.9%,环比下滑15.2%;经调整净利润60.72亿元,同比下滑43.1%,环比下滑4.4%。其中,小米手机×AIoT(人工智能物联网)分部收入793亿元,毛利率为22.5%,智能电动汽车及AI(人工智能)等创新业务分部收入199亿元。当季新车交付80856辆;研发投入90亿元,同比增长33.4%。
其中,AI已成为小米投入力度最大的领域,公司表示,今年AI领域至少投入160亿元,与此同时,雷军宣布,未来三年在AI领域投入600亿元,预计全年研发投入超400亿元。目前,MiMo-V2.5-Pro已在Artificial Analysis榜单综合智能指数、Agent指数上位列全球开源模型并列第一。
而在小米宣布大模型MiMo-V2.5系列API实施永久降价后,小米集团合伙人、总裁,手机部总裁,小米品牌总经理卢伟冰也转发了@小米技术微博表示,一早看到好消息,帮大家划下重点:小米MiMo-V2.5系列API永久降价,Token plan用量提升5-8倍,已订阅用户额度全部重置!这背后是我们在模型推理系统上的持续优化。有技术的精进,才能有更好Token Plan,更香的价格,继续加油!

DeepSeek已先一步开启“永久降价”
MiMo是小米公司2026年3月正式推出的自研大模型系列,由前DeepSeek核心技术人才罗福莉带队研发
2025年11月,曾任职DeepSeek的95后AI技术人才罗福莉正式加盟小米,出任MiMo大模型负责人,组建起平均年龄25岁、清北毕业生占比超六成的研发团队。有消息显示,雷军以千万年薪力邀罗福莉加入小米。
在罗福莉的统筹下,小米MiMo大模型完成多代快速迭代,今年3月正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型,后续迭代升级出V2.5进阶版本,补齐高性能推理、轻量化通用交互、语音合成等全场景能力,成为小米大模型阵列中面向商用普惠市场的主力产品。
小米宣布降价前,国内另一头部大模型公司DeepSeek已先一步开启“永久降价”,主要针对DeepSeek-V4-Pro模型,对应API于5月31日结束限时优惠后,整体调整为原定价的四分之一。调价后,输入缓存命中0.025元/百万tokens、未命中缓存3元/百万tokens、输出6元/百万tokens,相较原价实现75%的降幅。

除小米与DeepSeek外,国内大模型市场也呈现出明显的K型分化特征。阿里云通义千问、字节跳动豆包等通用型大模型相继下调API调用价格,而智谱GLM、腾讯混元等主打企业定制服务的模型则维持价格稳定甚至小幅上调,形成“通用模型降价走量、高端模型溢价保值”的新格局。
编辑 包程立 综合界面新闻、齐鲁晚报、21世纪经济报道等
审核 冯玲玲