400 128 6709

行业新闻

小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型

发布时间:2025-12-17点击次数:

小米正式开源 xiaomi mimo-v2-flash——一款由小米自主研发、专为极致推理性能优化的 moe 大模型,总参数量达 309b(激活参数仅 15b)。该模型创新性融合 hybrid 注意力机制与多层级 mtp 推理加速技术,在多项 agent 能力评测中稳居全球开源模型前两名;其代码生成能力超越所有现有开源模型,与顶级闭源模型 claude 4.5 sonnet 持平,而推理成本仅为后者的 2.5%,生成速度更提升至 2 倍,真正实现了大模型效果与效率的双重突破。

小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型

MiMo-V2-Flash 模型整体架构如下:

小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型

MiMo-V2-Flash 核心设计亮点:

  • 混合注意力机制

采用比例为 5:1 的 Sliding Window Attention(SWA)与 Global Attention(GA)协同结构,滑动窗口大小设为 128,原生支持 32K 上下文,并在训练中扩展至 256K。大量前期实验表明,SWA 在通用性、长文本建模及推理稳定性方面全面优于主流 Linear Attention,同时具备固定尺寸的 KV Cache,极大简化了与现有训练与推理基础设施(Infra)的集成适配流程。

  • MTP 推理加速技术

通过 Multi-Token Prediction(MTP)方式强化基座模型能力,并在推理阶段实现多 Token 并行验证,有效缓解传统自回归解码在大 Batch 场景下的显存带宽瓶颈。实测数据显示:启用 3 层 MTP 后,接收长度提升 2.8~3.6 倍,端到端推理加速比达 2.0~2.6 倍。

综上,MiMo-V2-Flash 凭借模型结构与训推系统深度协同的创新设计,可在不同硬件平台上灵活调节 Batch Size 与 MTP 层数,充分释放 GPU 算力,兼顾高吞吐、低延迟与极致推理性能。

Topaz Video AI Topaz Video AI

一款工业级别的视频增强软件

Topaz Video AI 511 查看详情 Topaz Video AI

Xiaomi MiMo-V2-Flash 全量模型权重与推理代码均已开源。配套 API 当前限时免费开放,Web 版 Demo 已正式上线。

小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型

访问 platform.xiaomimimo.com,即可无缝接入 Claude Code、Cursor、Cline、Kilo Code 等主流开发框架。

立即前往 MiMo Studio Web 端:aistudio.xiaomimimo.com,免费体验模型能力。

源码地址:点击下载

以上就是小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型的详细内容,更多请关注其它相关文章!


# ai  # win  # claude  # 小米  # 集体建设用地出让网站  # 桂园网站推广方案  # seo 应用哪些标签  # 河南实力网站优化首选  # 海东爱采购关键词排名了解  # 洛阳全网推广营销中心  # 创业小项目网站建设建议  # 衡水营销推广要多少钱  # 稳定seo推广咨询  # 莆田抖音优化seo  # 设为  # 此前  # 北京  # 首家  # 被称为  # 仍是  # 并在  # 徐州  # 基座  # 开源  # red  # 大模型 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 网易易盾 AI Lab 论文入选 ICASSP 2025!黑科技让语音识别越“听”越准  BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」  美军AI无人机“误杀”操作员,人工智能要在军事领域毁灭人类?  华为小艺AI助手将实现强大的大模型能力  OpenAI 已全面开放 GPT-3.5 Turbo、DALL-E 及 Whisper API  你们的开机第一屏画面要变了!安卓机器人首次3D化  最大助力35公斤 外骨骼机器人或在养老、医疗领域“大展身手”  科学家称,面对人工智能,人类未来或只有灭亡与虚拟永生两个选择  Meta推出VR订阅服务Quest +:每月免费玩两款游戏,7.99美元/月  广州团建公司方案 | 绝密飞行 → X-PLANE无人机团建主题团建  改变城市交通:智慧城市中的智能交通  “世界人工智能之都”的新烦恼:AI热潮无法拉动大量就业  推动综合能源服务高质量发展  消息称 Meta Quest 将推 VR 游戏订阅:每月 7.99 美元,任选两款  当人工智能开始写高考作文?作家陈崇正、朱山坡谈文学与未来  人工智能框架生态峰会即将召开,聚焦AI大模型技术与科学智能探索!  人手一部「*」!视频版Midjourney免费可用,一句话秒生酷炫大片惊呆网友  人工智能如何与智能家居集成  清华&中国气象局大模型登Nature:解决世界级难题,「鬼天气」预报时效首次达3小时  世界人工智能大会机器人同台炫技!梳理A股相关业务营收占比超50%的个股名单  昇思开源社区理事会成立,基于昇思AI框架的全模态大模型“紫东.太初2.0”发布  五个出色的人工智能应用实例  鸿蒙生态带来了哪些新的流量可能性,包括AI、服务分发和原生智能等方面?  AI 冥想应用 Ogimi.ai 推出,可为用户提供教练级个性化指导  国内阅读行业首款对话式AI应用“阅爱聊”封闭内测  苹果在韩举办首届中小企业智能制造论坛,加速推动工业4.0发展  电力人工智能数据集目录首次发布  Snap宣布研发出新技术 可大幅提升AI生成图像速度  字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA  解决导航“最后50米”难题 高德地图升级AR步行导航找终点功能  消息称 ChatGPT 未来有望增加更多功能:上传文件分析信息,还能记住用户画像  调查:过半数艺术家认为 AI 作图无法帮助他们的工作  云米Smart 2E AI立式空调开启预售:新三级能效,到手价3899元  对Hugging Face开源模型精准投毒!LLM切脑后变身PoisonGPT,用虚假事实洗脑60亿人  洞穴探险神器?可自主导航的单旋翼自旋无人机,效率更高!  世界人工智能大会高合发表演讲,HiPhi Y即将全球上市  Prompt解锁语音语言模型生成能力,SpeechGen实现语音翻译、修补多项任务  华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来  软通动力多项AI创新产品及应用亮相2025世界人工智能大会  企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的  华为联合合作伙伴 共同发布昇腾AI大模型训推一体化解决方案  13 个提高生产力的 AI 工具  AI行业盛会大咖云集!Sam Altam、“AI教父”......一文看懂最新观点  赋能金融新生态,多家银行创新应用成果亮相世界人工智能大会  笔神作文声讨学而思AI大模型 称用“爬虫”技术盗取数据  焊接协作机器人或将成为26届埃森展最大看点  Meta将VR头显最低年龄限制从13岁降至10岁  【机智云物联网低功耗转接板】远程环境数据采集探索  中国最强AI研究院的大模型为何迟到了  百度举办AIGC创作沙龙,现场传授AI绘画“咒语”技巧 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司