发布时间:2025-09-01
点击次数: 美团正式推出 longcat-flash-chat,并宣布全面开源。该模型基于创新的混合专家系统(mixture-of-experts, moe)架构,总参数规模达 560b,实际激活参数范围为
18.6b~31.3b(平均约 27b),在保障高性能的同时显著提升了计算效率。
评测结果显示,LongCat-Flash-Chat 作为一款非推理型基础模型,在仅激活少量参数的情况下,整体表现可与当前主流领先模型相媲美,尤其在智能体任务中展现出卓越能力。得益于专为推理效率优化的架构设计,其响应速度大幅提升,特别适用于需要长时间运行的复杂智能体应用场景。
LongCat-Flash 引入了“零计算专家(Zero-Computation Experts)”机制,模型总参数高达 560B,但每个 token 处理时仅根据上下文动态激活 18.6B 至 31.3B 参数,实现算力资源的精准调度与高效使用。为控制整体计算开销,训练过程中引入 PID 控制器实时调节专家层偏置,确保单个 token 的平均激活参数稳定在约 27B。
模型还设计了跨层通信通道,大幅提升了 MoE 架构下计算与通信的并行度,显著增强训练和推理效率。结合定制化的底层系统优化,LongCat-Flash 在 30 天内即完成高效训练,并在 H800 硬件平台上实现超过 100 tokens/s 的用户端推理速度。此外,团队对主流大模型组件和训练流程进行了多项改进,采用超参迁移与模型层叠加策略,配合多种稳定性保障手段,确保训练过程平稳高效。
针对智能体能力的提升,LongCat-Flash 自主构建了 Agentic 评测集以指导数据筛选与训练策略优化,采用多智能体协同生成机制产出丰富且高质量的行为轨迹数据,在整个训练链路中深度优化智能体表现,最终实现行业领先的 Agentic 能力。
通过算法与工程系统的协同创新,LongCat-Flash 在理论成本与推理速度上均超越同级别甚至更小规模的现有模型;经系统级优化后,在 H800 上实现 100 tokens/s 的生成速率,同时将输出成本压缩至仅 5元/百万 token。
小云雀
剪映出品的AI视频和图片创作助手
1949
查看详情

官方同步提供基于 SGLang 和 vLLM 的两种高效部署方式。以下为使用 SGLang 在单机环境下部署的示例命令:
python3 -m sglang.launch_server \`` --model meituan-longcat/LongCat-Flash-Chat-FP8 \`` --trust-remote-code \`` --attention-backend flashinfer \`` --enable-ep-moe \`` --tp 8
源码地址:点击下载
以上就是美团正式发布并开源 LongCat-Flash-Chat的详细内容,更多请关注其它相关文章!
# 更大
# 优化关键词覆盖率排名
# 免费网站建设模板软件
# 长春seo排名系统
# seo免费别墅模型图纸
# seo入口灰色
# 教学网站建设 效益
# 按月seo
# seo快排资源
# seo优化推广价格多少
# 茂名营销推广品牌
# 长时间
# python
# 两种
# 盘发
# 百度网
# 高难度
# 最受欢迎
# 正式发布
# 美国政府
# 开源
# deepseek
# 工具
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
推动企业数字化转型升级!“松江智造”摘世界人工智能大会重磅奖项
五个出色的人工智能应用实例
人工智能进入绿植界,智能庭院市场初具规模
科普:什么是AI大模型
朱民:普通人炒股炒不过机器人是很正常的 AI已经能理解市场情绪
13万个注释神经元,5300万个突触,普林斯顿大学等发布首个完整「成年果蝇」大脑连接组
加强能源消费绿色转型政策引导
原小米 9 号员工李明打造全球首款 AI 安卓桌面机器人
Meta Quest订阅服务每月7.99美元畅玩两款VR游戏应用
2025世界人工智能大会前沿科技共绘“未来”图景, 这家这家独角兽企业的通用大脑将在AI领域大放异彩
优地网络助力新媒体拥抱人工智能时代
PS AI修图免费平替来了!Stability AI又放大招,核弹级更新一键扩图
《自然》杂志拒绝刊登人工智能生成的图片和视频
Adobe旗下Illustrator引入生成式AI工具Firefly
揭秘AI数字人语录:抖音AI小和尚、老者语录能赚钱吗?
云南首例达芬奇机器人微创心脏手术成功开展
机器人技能大比拼
无人机巡检方案是什么,该如何选择适合的巡检方案
Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽
探索AI前沿理念 2025全球人工智能技术大会在杭州开幕
放弃自动驾驶,也是一种和解
IBM CEO克里希纳:人工智能潜在创新无法被监管
这效果能打几分?AI真人化《名侦探柯南》
Spotify计划推出AI驱动的音乐播放器功能
在心理治疗中用VR技术,治疗成效显著提高
鸿蒙智能座舱的AI大模型革新,引领智能座舱领域的变革吗?
麦肯锡:到 2045 年左右,将有 50% 工作被 AI 接管
京东 AI 大模型官宣 7 月 13 日发布,还有重磅合作
读创正式上线“读创AI聊”功能
企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的
世界人工智能大会高合发表演讲,HiPhi Y即将全球上市
组建团队,字节跳动要造机器人?
意大利警察拟用AI预测犯罪 该算法被指种族歧视严重
斑马推出全新升级版思维机:以人工智能为核心的交互式学习体验
人工智能在交通领域的革新:智能解决方案彻底改变交通方式
看了天美对AI的布局,我感觉它想得是真明白
Yann LeCun团队新研究成果:对自监督学习逆向工程,原来聚类是这样实现的
V社谈AI制作游戏被ban:为确保开发者有素材所有权
五个IntelliJ IDEA插件,高效编写代码
北京公司实施AI技术,推行4.5天工作制,抵制996文化,提升员工工作幸福感
跟着AI大热的“光模块”到底是什么?
助力人工智能产业高质量发展 龙岗区算法训练基地正式启用
AIGC浪潮下,联想集团再加码计算与人工智能
前特斯拉总监、OpenAI大牛Karpathy:我被自动驾驶分了心,AI智能体才是未来!
江永:精准施训提升通信无人机应急救援能力
高质量数据推动AI场景化应用快速发展及落地
网易云音乐内测上线“私人DJ” 打造AI推荐音乐助手
卫星通信牵引物联网竞争升维,模组厂商如何决胜百亿市场?
构建数字文旅新高地!洛阳涧西区开启元宇宙时代
生成式AI与云结合,机遇与挑战并存