发布时间:2025-12-17
点击次数: 小米正式开源 xiaomi mimo-v2-flash——一款由小米自主研发、专为极致推理性能优化的 moe 大模型,总参数量达 309b(激活参数仅 15b)。该模型创新性融合 hybrid 注意力机制与多层级 mtp 推理加速技术,在多项 agent 能力评测中稳居全球开源模型前两名;其代码生成能力超越所有现有开源模型,与顶级闭源模型 claude 4.5 sonnet 持平,而推理成本仅为后者的 2.5%,生成速度更提升至 2 倍,真正实现了大模型效果与效率的双重突破。

MiMo-V2-Flash 模型整体架构如下:

MiMo-V2-Flash 核心设计亮点:
采用比例为 5:1 的 Sliding Window Attention(SWA)与 Global Attention(GA)协同结构,滑动窗口大小设为 128,原生支持 32K 上下文,并在训练中扩展至 256K。大量前期实验表明,SWA 在通用性、长文本建模及推理稳定性方面全面优于主流 Linear Attention,同时具备固定尺寸的 KV Cache,极大简化了与现有训练与推理基础设施(Infra)的集成适配流程。
通过 Multi-Token Prediction(MTP)方式强化基座模型能力,并在推理阶段实现多 Token 并行验证,有效缓解传统自回归解码在大 Batch 场景下的显存带宽瓶颈。实测数据显示:启用 3 层 MTP 后,接收长度提升 2.8~3.6 倍,端到端推理加速比达 2.0~2.6 倍。
综上,MiMo-V2-Flash 凭借模型结构与训推系统深度协同的创新设计,可在不同硬件平台上灵活调节 Batch Size 与 MTP 层数,充分释放 GPU 算力,兼顾高吞吐、低延迟与极致推理性能。
T
opaz Video AI
一款工业级别的视频增强软件
511
查看详情
Xiaomi MiMo-V2-Flash 全量模型权重与推理代码均已开源。配套 API 当前限时免费开放,Web 版 Demo 已正式上线。

访问 platform.xiaomimimo.com,即可无缝接入 Claude Code、Cursor、Cline、Kilo Code 等主流开发框架。
立即前往 MiMo Studio Web 端:aistudio.xiaomimimo.com,免费体验模型能力。
源码地址:点击下载
以上就是小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型的详细内容,更多请关注其它相关文章!
# ai
# win
# claude
# 小米
# 集体建设用地出让网站
# 桂园网站推广方案
# seo 应用哪些标签
# 河南实力网站优化首选
# 海东爱采购关键词排名了解
# 洛阳全网推广营销中心
# 创业小项目网站建设建议
# 衡水营销推广要多少钱
# 稳定seo推广咨询
# 莆田抖音优化seo
# 设为
# 此前
# 北京
# 首家
# 被称为
# 仍是
# 并在
# 徐州
# 基座
# 开源
# red
# 大模型
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
网易易盾 AI Lab 论文入选 ICASSP 2025!黑科技让语音识别越“听”越准
BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」
美军AI无人机“误杀”操作员,人工智能要在军事领域毁灭人类?
华为小艺AI助手将实现强大的大模型能力
OpenAI 已全面开放 GPT-3.5 Turbo、DALL-E 及 Whisper API
你们的开机第一屏画面要变了!安卓机器人首次3D化
最大助力35公斤 外骨骼机器人或在养老、医疗领域“大展身手”
科学家称,面对人工智能,人类未来或只有灭亡与虚拟永生两个选择
Meta推出VR订阅服务Quest +:每月免费玩两款游戏,7.99美元/月
广州团建公司方案 | 绝密飞行 → X-PLANE无人机团建主题团建
改变城市交通:智慧城市中的智能交通
“世界人工智能之都”的新烦恼:AI热潮无法拉动大量就业
推动综合能源服务高质量发展
消息称 Meta Quest 将推 VR 游戏订阅:每月 7.99 美元,任选两款
当人工智能开始写高考作文?作家陈崇正、朱山坡谈文学与未来
人工智能框架生态峰会即将召开,聚焦AI大模型技术与科学智能探索!
人手一部「*」!视频版Midjourney免费可用,一句话秒生酷炫大片惊呆网友
人工智能如何与智能家居集成
清华&中国气象局大模型登Nature:解决世界级难题,「鬼天气」预报时效首次达3小时
世界人工智能大会机器人同台炫技!梳理A股相关业务营收占比超50%的个股名单
昇思开源社区理事会成立,基于昇思AI框架的全模态大模型“紫东.太初2.0”发布
五个出色的人工智能应用实例
鸿蒙生态带来了哪些新的流量可能性,包括AI、服务分发和原生智能等方面?
AI 冥想应用 Ogimi.ai 推出,可为用户提供教练级个性化指导
国内阅读行业首款对话式AI应用“阅爱聊”封闭内测
苹果在韩举办首届中小企业智能制造论坛,加速推动工业4.0发展
电力人工智能数据集目录首次发布
Snap宣布研发出新技术 可大幅提升AI生成图像速度
字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA
解决导航“最后50米”难题 高德地图升级AR步行导航找终点功能
消息称 ChatGPT 未来有望增加更多功能:上传文件分析信息,还能记住用户画像
调查:过半数艺术家认为 AI 作图无法帮助他们的工作
云米Smart 2E AI立式空调开启预售:新三级能效,到手价3899元
对Hugging Face开源模型精准投毒!LLM切脑后变身PoisonGPT,用虚假事实洗脑60亿人
洞穴探险神器?可自主导航的单旋翼自旋无人机,效率更高!
世界人工智能大会高合发表演讲,HiPhi Y即将全球上市
Prompt解锁语音语言模型生成能力,SpeechGen实现语音翻译、修补多项任务
华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来
软通动力多项AI创新产品及应用亮相2025世界人工智能大会
企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的
华为联合合作伙伴 共同发布昇腾AI大模型训推一体化解决方案
13 个提高生产力的 AI 工具
AI行业盛会大咖云集!Sam Altam、“AI教父”......一文看懂最新观点
赋能金融新生态,多家银行创新应用成果亮相世界人工智能大会
笔神作文声讨学而思AI大模型 称用“爬虫”技术盗取数据
焊接协作机器人或将成为26届埃森展最大看点
Meta将VR头显最低年龄限制从13岁降至10岁
【机智云物联网低功耗转接板】远程环境数据采集探索
中国最强AI研究院的大模型为何迟到了
百度举办AIGC创作沙龙,现场传授AI绘画“咒语”技巧