400 128 6709

行业新闻

美团正式发布并开源 LongCat-Flash-Chat

发布时间:2025-09-01点击次数:

美团正式推出 longcat-flash-chat,并宣布全面开源。该模型基于创新的混合专家系统(mixture-of-experts, moe)架构,总参数规模达 560b,实际激活参数范围为 18.6b~31.3b(平均约 27b),在保障高性能的同时显著提升了计算效率。

评测结果显示,LongCat-Flash-Chat 作为一款非推理型基础模型,在仅激活少量参数的情况下,整体表现可与当前主流领先模型相媲美,尤其在智能体任务中展现出卓越能力。得益于专为推理效率优化的架构设计,其响应速度大幅提升,特别适用于需要长时间运行的复杂智能体应用场景。

核心技术优势

LongCat-Flash 引入了“零计算专家(Zero-Computation Experts)”机制,模型总参数高达 560B,但每个 token 处理时仅根据上下文动态激活 18.6B 至 31.3B 参数,实现算力资源的精准调度与高效使用。为控制整体计算开销,训练过程中引入 PID 控制器实时调节专家层偏置,确保单个 token 的平均激活参数稳定在约 27B。

模型还设计了跨层通信通道,大幅提升了 MoE 架构下计算与通信的并行度,显著增强训练和推理效率。结合定制化的底层系统优化,LongCat-Flash 在 30 天内即完成高效训练,并在 H800 硬件平台上实现超过 100 tokens/s 的用户端推理速度。此外,团队对主流大模型组件和训练流程进行了多项改进,采用超参迁移与模型层叠加策略,配合多种稳定性保障手段,确保训练过程平稳高效。

针对智能体能力的提升,LongCat-Flash 自主构建了 Agentic 评测集以指导数据筛选与训练策略优化,采用多智能体协同生成机制产出丰富且高质量的行为轨迹数据,在整个训练链路中深度优化智能体表现,最终实现行业领先的 Agentic 能力。

通过算法与工程系统的协同创新,LongCat-Flash 在理论成本与推理速度上均超越同级别甚至更小规模的现有模型;经系统级优化后,在 H800 上实现 100 tokens/s 的生成速率,同时将输出成本压缩至仅 5元/百万 token。

小云雀 小云雀

剪映出品的AI视频和图片创作助手

小云雀 1949 查看详情 小云雀

性能表现

美团正式发布并开源 LongCat-Flash-Chat

  • 通用知识能力方面,LongCat-Flash 表现强劲:ArenaHard-V2 基准测试得分高达 86.50,位居参评模型第二,展现出在高难度一对一评测中的稳定竞争力。在基础能力测试中同样表现出色,MMLU 得分为 89.71,CEval 达到 90.44,整体水平与国内顶尖模型相当,且参数量少于 DeepSeek-V3.1、Kimi-K2 等同类产品,凸显其高效性。
  • 智能体工具调用方面,LongCat-Flash 具备明显领先优势:即使面对参数规模更大的模型,其在 τ2-Bench 工具使用基准中仍表现更优;在高复杂度任务场景下,于 VitaBench 基准测试中以 24.30 分高居榜首,充分验证其在复杂智能体任务中的强大执行能力。
  • 编程能力方面,LongCat-Flash 实力扎实:TerminalBench(终端命令任务)得分为 39.51,排名第二,体现其在真实智能体操作场景下的熟练度;SWE-Bench-Verified 测试中得分 60.4,具备较强的实际工程问题解决能力。
  • 指令遵循能力方面,LongCat-Flash 表现尤为突出:IFEval 基准测试得分 89.65,位列第一,表明其在处理复杂、精细指令时具备极高可靠性;同时在 COLLIE(中文指令遵循)和 Meeseeks-zh(中文多场景指令)评测中分别取得 57.10 和 43.03 的最佳成绩,充分展示其在中英文双语环境下对多样化高难度指令的精准理解与执行能力。

部署方案

官方同步提供基于 SGLang 和 vLLM 的两种高效部署方式。以下为使用 SGLang 在单机环境下部署的示例命令:

python3 -m sglang.launch_server \``    --model meituan-longcat/LongCat-Flash-Chat-FP8 \``    --trust-remote-code \``    --attention-backend flashinfer \``    --enable-ep-moe \``    --tp 8

源码地址:点击下载

以上就是美团正式发布并开源 LongCat-Flash-Chat的详细内容,更多请关注其它相关文章!


# 更大  # 优化关键词覆盖率排名  # 免费网站建设模板软件  # 长春seo排名系统  # seo免费别墅模型图纸  # seo入口灰色  # 教学网站建设 效益  # 按月seo  # seo快排资源  # seo优化推广价格多少  # 茂名营销推广品牌  # 长时间  # python  # 两种  # 盘发  # 百度网  # 高难度  # 最受欢迎  # 正式发布  # 美国政府  # 开源  # deepseek  # 工具 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 推动企业数字化转型升级!“松江智造”摘世界人工智能大会重磅奖项  五个出色的人工智能应用实例  人工智能进入绿植界,智能庭院市场初具规模  科普:什么是AI大模型  朱民:普通人炒股炒不过机器人是很正常的 AI已经能理解市场情绪  13万个注释神经元,5300万个突触,普林斯顿大学等发布首个完整「成年果蝇」大脑连接组  加强能源消费绿色转型政策引导  原小米 9 号员工李明打造全球首款 AI 安卓桌面机器人  Meta Quest订阅服务每月7.99美元畅玩两款VR游戏应用  2025世界人工智能大会前沿科技共绘“未来”图景, 这家这家独角兽企业的通用大脑将在AI领域大放异彩  优地网络助力新媒体拥抱人工智能时代  PS AI修图免费平替来了!Stability AI又放大招,核弹级更新一键扩图  《自然》杂志拒绝刊登人工智能生成的图片和视频  Adobe旗下Illustrator引入生成式AI工具Firefly  揭秘AI数字人语录:抖音AI小和尚、老者语录能赚钱吗?  云南首例达芬奇机器人微创心脏手术成功开展  机器人技能大比拼  无人机巡检方案是什么,该如何选择适合的巡检方案  Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽  探索AI前沿理念 2025全球人工智能技术大会在杭州开幕  放弃自动驾驶,也是一种和解  IBM CEO克里希纳:人工智能潜在创新无法被监管  这效果能打几分?AI真人化《名侦探柯南》  Spotify计划推出AI驱动的音乐播放器功能  在心理治疗中用VR技术,治疗成效显著提高  鸿蒙智能座舱的AI大模型革新,引领智能座舱领域的变革吗?  麦肯锡:到 2045 年左右,将有 50% 工作被 AI 接管  京东 AI 大模型官宣 7 月 13 日发布,还有重磅合作  读创正式上线“读创AI聊”功能  企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的  世界人工智能大会高合发表演讲,HiPhi Y即将全球上市  组建团队,字节跳动要造机器人?  意大利警察拟用AI预测犯罪 该算法被指种族歧视严重  斑马推出全新升级版思维机:以人工智能为核心的交互式学习体验  人工智能在交通领域的革新:智能解决方案彻底改变交通方式  看了天美对AI的布局,我感觉它想得是真明白  Yann LeCun团队新研究成果:对自监督学习逆向工程,原来聚类是这样实现的  V社谈AI制作游戏被ban:为确保开发者有素材所有权  五个IntelliJ IDEA插件,高效编写代码  北京公司实施AI技术,推行4.5天工作制,抵制996文化,提升员工工作幸福感  跟着AI大热的“光模块”到底是什么?  助力人工智能产业高质量发展 龙岗区算法训练基地正式启用  AIGC浪潮下,联想集团再加码计算与人工智能  前特斯拉总监、OpenAI大牛Karpathy:我被自动驾驶分了心,AI智能体才是未来!  江永:精准施训提升通信无人机应急救援能力  高质量数据推动AI场景化应用快速发展及落地  网易云音乐内测上线“私人DJ” 打造AI推荐音乐助手  卫星通信牵引物联网竞争升维,模组厂商如何决胜百亿市场?  构建数字文旅新高地!洛阳涧西区开启元宇宙时代  生成式AI与云结合,机遇与挑战并存 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司