400 128 6709

行业新闻

Liquid AI 发布 LFM2-8B-A1B:8B 参数仅激活 1.5B

发布时间:2025-10-11点击次数:

高效moe架构重塑边缘计算边界——liquid ai推出全新lfm2-8b-a1b模型,作为lfm2系列首款混合专家(mixture-of-experts, moe)架构模型,其总参数量达8.3b,但每token仅激活约1.5b参数。得益于稀疏激活机制,该模型在维持强大表达能力的同时显著降低计算开销,特别适用于手机、平板等资源受限的终端设备。与传统依赖云端部署的moe模型不同,lfm2-8b-a1b专为实时交互场景优化,突破了“小规模moe效率低下”的行业固有认知。

该模型基于LFM2混合骨干结构构建,包含18个门控短卷积块和6个分组查询注意力(GQA)模块。除前两层保持稠密以保障训练稳定性外,其余各层均集成稀疏MoE前馈网络。每一层配置32个专家,实际运行时仅激活top-4专家,并通过归一化sigmoid路由器结合自适应偏置策略,实现更均衡的专家负载分配。支持长达32K token的上下文输入,具备英文、阿拉伯文、中文、法文、德文、日文、韩文及西班牙文等多语言处理能力。

Liquid AI 发布 LFM2-8B-A1B:8B 参数仅激活 1.5B

训练与性能:12T token训练铸就媲美3-4B模型的能力

LFM2-8B-A1B历经约12万亿token的预训练过程,数据分布涵盖55%英文、25%多语言文本以及20%代码内容。后续采用Liquid Preference Alignment技术(融合长度归一化的DPO与APO-Zero方法)进行对齐训练,借助混合BF16/FP8精度方案,使整体训练效率提升超3倍。

在多项基准测试中表现亮眼:

  • 知识理解与指令遵循:MMLU-Pro得分37.4(相较LFM2-2.6B提升11.5),IFEval达77.6,Multi-IF为58.2。
  • 数学推理能力:GSM8K成绩84.4,GSMPlus为64.8,MATH500高达74.2。
  • 多语言任务表现:MGSM达到72.4,MMMLU得分为55.3。
  • 编程与写作生成:HumanEval+得分69.5,LiveCodeBench v6为21.0,EQ-Bench为44.2。

综合来看,其输出质量可对标3-4B级别的稠密模型,在多轮对话连贯性、创意文本生成、RAG检索增强回答以及工具调用等复杂任务中展现出卓越能力。

Motiff妙多 Motiff妙多

Motiff妙多是一款AI驱动的界面设计工具,定位为“AI时代设计工具”

Motiff妙多 334 查看详情 Motiff妙多

部署与集成:最高5倍加速,全面兼容主流框架

LFM2-8B-A1B在CPU与GPU上的推理速度表现突出。在搭载AMD Ryzen AI 9 HX 370和三星Galaxy S24 Ultra等设备上,采用int4量化配合int8动态激活,并运行定制化XNNPACK MoE内核时,解码吞吐量相较Qwen3-1.7B、IBM Granite 4.0等同类模型最高提升达5倍。

GPU端已集成vLLM推理引擎,支持FlashInfer与CUDA graph编译优化,兼顾单请求低延迟与高并发在线批处理需求。

针对移动端与轻量级设备,模型提供多种量化版本:Q4_0格式仅需约4.7GB存储空间,F16版本约为16.7GB。目前支持llama.cpp(需b6709及以上版本并启用lfm2moe支持)、ExecuTorch(适用于移动及嵌入式CPU)和vLLM(GPU平台)三大主流框架。此外,Hugging Face已开放GGUF量化文件下载,并配套提供Colab微调笔记本,助力开发者快速部署与二次开发。该模型现已上线Liquid Playground平台,供用户在线体验与测试。

以上就是Liquid AI 发布 LFM2-8B-A1B:8B 参数仅激活 1.5B的详细内容,更多请关注其它相关文章!


# 工具  # 阿拉伯文  # 边缘  # 英文  # 适用于  # qwen  # 二次开发  # ultra  # 多语言  # 路由  # amd  # ai  # 三星  # 平板  # 路由器  # 边缘计算  # 抖音旅行的关键词排名  # 禹州展示型网站建设  # 网络推广seo专员  # 宝安教育网站推广方案  # seo锁定关键词  # 网站推广选择哪个  # 常州品牌推广招聘网站  # seo人员组成  # 炎陵淘宝营销推广  # 谍中谍小说网站建设游戏  # 西班牙文  # 可由  # 淘宝  # 新能源  # 门控 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 微软向美国政府提供GPT的大模型,安全性如何保证?  人工智能在重症监护室的未来  先进技术在防止全球数据丢失方面的作用  生成式AI引路产业加速来袭,微美全息探索“AIGC+虚拟人”融合应用  测试框架-安全和自动驾驶  AIGC 风潮刮到游戏产业,巨人网络与阿里云达成“游戏 +AI ”合作  破解零碳产业园建设规范和成果评价难题  国内阅读行业首款对话式AI应用“阅爱聊”封闭内测  日新月异,脑机接口技术都有哪些新应用?  Meta推出VR订阅服务Quest +:每月免费玩两款游戏,7.99美元/月  智能技术提高现代商业运营的7七种方式  能走、能飞、能游泳,科学家打造全能 M4 机器人  618京东3C数码趋势产品备受青睐 AR设备成交额同比增长15倍  13条咒语挖掘GPT-4最大潜力,Github万星AI导师火了,网友:隔行再也不隔山了  PHP和OpenCV库:如何实现人脸识别  DeepMind推惊世排序算法,C++库忙更新!  软银、淡马锡、沙特阿美突击入股,“协作机器人第一股”节卡股份:强敌环伺,持续失血是常态  日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病  奥比中光子公司和斯坦德机器人深度合作,共同推进新一代激光雷达的研发  IBM CEO克里希纳:人工智能潜在创新无法被监管  美图第二届影像节发布七款AI影像创作工具  这效果能打几分?AI真人化《名侦探柯南》  科学家称,面对人工智能,人类未来或只有灭亡与虚拟永生两个选择  昇思开源社区理事会成立,基于昇思AI框架的全模态大模型“紫东.太初2.0”发布  国内首款大尺寸仿鸵双足机器人“大圣”亮相,穿戴红色战袍  “五年内人类程序员将消失”预言引争议,AI真的那么强大了吗?  爱设计 AI 一键生成 PPT 工具上线:输入标题即可生成 PPT  以计算机视觉技术为基础的库存管理如何改革零售行业  AIGC浪潮下,联想集团再加码计算与人工智能  微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课  AI 作画工具 Midjourney 推出“pan”功能,可平移扩展图片外场景  当人工智能开始写高考作文?作家陈崇正、朱山坡谈文学与未来  特斯拉首发人形机器人“擎天柱”亮相世界人工智能大会  华为盘古AI模型实现秒级全球气象预报时间缩短  Meta 推出 Quest 超级分辨率技术,让 VR 画面更清晰  普渡机器人与变形金刚品牌合作,特别活动爆火,商品售罄!  2025VR&AR显示技术峰会视频解析: 歌尔光学展示最新一代VR/AR光学模组  电池比 Air 2S 大 20%,大疆 Air 3 无人机现身 FCC  探展WAIC | 第四范式“式说”聚焦toB大模型,布局生成式AI重构企业软件  爱设计PPT发布第二代AI一键生成PPT产品:智能、个性化、自动化  午报 | 字节跳动要造机器人;东方甄选首次启动自有APP|直播|  携程发布旅游行业垂直大模型 梁建章:AI策略是做可靠的内容 放心的推荐  为AI而服务设计:构建以人为本的AI创新方法  如布科技发布新产品AI口袋学习机S12  关于开展“与AI共创未来”——2025年全国青少年人工智能创新实践活动的通知  美图影像节演讲实录:191次提及AI,发布7款影像生产力工具  如布AI口袋学习机S12 将亮相综艺节目《好样的!国货》  再度重仓 AI 赛道,SaaS 巨头 Salesforce 扩大 AIGC 风投基金规模  编程已死,AI 当立?教授公开“唱反调”:AI 还帮不了程序员  ​《流浪地球2》里机器人公司的创始人:未来10年,机器人的崛起! 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司