发布时间:2025-07-29
点击次数: 7月27日,移远通信正式宣布与rwkv公司达成深度战略合作,双方将基于移远的高性能算力平台,对rwkv最新模型架构进行优化与适配,携手推进大模型在终端设备上的低资源、高效率部署。此次合作成果首次在2025世界人工智能大会(waic)上惊艳亮相,标志着端侧大模型技术向更高效能、更广泛应用场景迈出了重要一步。

RWKV(Receptance Weighted KeyValue)是全球领先的RNN类大模型架构,创新性地融合了递归神经网络(RNN)的恒定计算复杂度与高效串行推理能力,同时吸收了Transformer的并行训练优势,在文本生成、语音处理、图像视频分析及时间序列预测等多个领域表现卓越,且训练与推理成本远低于传统Transformer模型。
其核心技术在于以RWKV算子替代Transformer中的位置编码和多头注意力机制,成功破解了后者在处理长序列时面临的内存与时间复杂度激增难题。该设计实现了token级计算和内存占用的恒定,无论序列多长,推理速度与资源消耗均保持稳定,从而显著提升效率。这一特性使其在资源受限的终端设备中极具优势,堪称赋予终端一个“轻量级AI大脑”。
在WAIC 2025展会上,基于高通QCS8550平台的两大联合解决方案重磅发布:
● RWKVChat:持续思考,离线对话
RWKVChat是一款完全离线运行的AI聊天应用,无需联网即可实现本地推理、深度对话与文本续写,支持个性化设置,成为用户随身的“智能助手”。例如,搭载于高通手机平台的RWKV7-G12.9B模型,推理速度可达30token/s。得益于RWKV架构无需KV缓存的特性,在长时间对话中仍能保持速度与内存占用的恒定,体验流畅不卡顿。

● RWKVSudoku:超长链式推理
RWKV数独展示了仅20M参数的小模型在超长思维链(Chain-of-Thought, CoT)任务中的惊人表现。凭借恒定内存占用与极低token消耗,它能够高效解决复杂数独难题,直观体现了RWKV在端侧设备上实现高效推理的巨大潜力。

Reachout.ai
一个AI驱动的视频开发平台,专为忙碌的企业家和销售团队打造
142
查看详情
在当前Transformer主导的大模型技术格局下,移远通信展现出前瞻性的战略布局,积极拓展非Transformer技术路径,致力于为行业提供更低功耗、更少内存依赖的端侧AI解决方案。
本次展出的RWKV7-G11.5B模型,在移远通信SG885G模组上经过深度工程优化后,性能表现远超同参数量级的Transformer模型。实测数据显示:
在Prefill阶段:
在Decoding阶段:
SG885G模组基于高通QCS8550平台打造,具备高达48TOPS的AI算力,可支持约7B参数的多模态模型本地推理,实现图像理解与多源信息融合的实时响应。在模型兼容方面,移远已构建完善的端侧适配体系,全面支持Llama、通义千问、DeepSeek等主流开源模型,覆盖0.5B至8B参数范围,打造了一个功能强大的端侧大模型运行平台。尤为关键的是,SG885G率先支持非Transformer路线的RWKV7架构,大幅降低对硬件资源的需求。
移远通信首席运营官张栋表示:“此次与RWKV的合作,是我们‘让终端拥有AI大心脏’理念的重要实践。RWKV的线性注意力机制,彻底打破了终端设备处理长序列数据的瓶颈。结合移远的高算力模组,我们真正把大模型‘装进’了物联网终端。当农机能‘读懂’土壤状态,当手表可‘预判’健康风险,AI就不再只是云端的概念,而是深入田间地头、融入日常生活的现实力量。”
RWKV联合创始人兼COO罗璇表示:“我们的目标是让每一台设备都具备思考能力,就像植入一颗会学习的‘大脑’。随着RWKV架构在移远算力平台上的规模化落地,终端将突破资源限制,形成‘云端能力+本地智能’的双轮驱动生态,为万物智联时代打下坚实的技术基础。”
移远通信与RWKV的强强联合,不仅是硬件与算法的深度融合,更是推动智能普惠化的重要里程碑,让大模型真正从云端走向终端,赋能千行百业、千家万户。
7月26日至29日,欢迎莅临WAIC 2025移远通信展台(H1D815),亲身体验端侧大模型带来的智能变革。
以上就是端侧大模型迎来轻革命:移远通信x RWKV 打造轻量AI大脑的详细内容,更多请关注其它相关文章!
# ai
# 新闻资讯
# 双轮
# 高通
# 让我
# 涞水
# 离线
# 终端设备
# 递归
# 2025
# deepseek
# 内存占用
# seo教程基础关键词
# seo培训课竞价
# 会员营销如何推广方案
# 合肥网站建设的定位
# seo所有工具大全
# 南雄外贸seo
# 西安网路营销推广招聘
# 柳城独特网站建设策略
# 怎样做好产品推广和营销
# 论坛seo教程
# 睡不着
# 链式
# 日本
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
DreamAvatar数字人在哪里下载
赋能选题探索:AI助手在经济学专业中的应用指南
微软商店 AI 摘要功能开启预览,帮助用户迅速了解应用评价
清华&中国气象局大模型登Nature:解决世界级难题,「鬼天气」预报时效首次达3小时
微软更新服务协议,以防止通过AI服务进行逆向工程和数据抓取
这效果能打几分?AI真人化《名侦探柯南》
人工智能改变网络安全和用户体验的三种方式
码刻 | 48小时Hackathon,源码见证新生代AI创新的发生
人工智能:解决劳动力短缺的关键策略
热点资讯:家乐福推出聊天机器人;米哈游2025年营收273.4亿元…
站在社会的高度理解人工智能
WPS AI 官网上线:可申请体验官资格,支持 Windows、安卓端下载
城市在采用人工智能方面进展如何?
Ai智能机器人,chat-免注册登入,直接使用新版gpt4.0!
世界人工智能大会(WAIC 2025)点燃魔都,博尔捷数字科技携前沿技术产品亮相
论文插图也能自动生成了,用到了扩散模型,还被ICLR接收
Win11 AI 助手 Windows Copilot 被吐槽:套皮的 Edge 浏览器
百亿量化私募:量化投资进入“精耕细作”时代 AI带来行业新变革
写出优质文章的妙招:利用"稿见AI助手"的实用指南
研究发现AI聊天机器人ChatGPT不会讲笑话,只会重复25个老梗
人工智能产业协同创新中心:全产业链资源在这里汇聚
烟台大学学生首次在全国大学生无人机航拍竞赛中获奖
刊·见 | 捕捉人工智能领域最新动态?收藏Applied Artificial Intelligence
花16000元买四款扫拖机器人!科沃斯追觅石头小米谁能笑到最后?
电力人工智能数据集目录首次发布
三星加速AR眼镜进程,预计明年上半年亮相
6月14日《星空下的对话》 张朝阳陆川将畅聊人生、电影、心理学与AI
羊驼家族大模型集体进化!32k上下文追平GPT-4,田渊栋团队出品
人工智能时代 数字文明对话向“尼”走来
微幼科技晨检机器人与人工晨检相比,有何优势
微软 Azure AI 文本转语音服务升级:新增男性声音和扩展语言支持
AI大模型紫东太初已被注册商标 中科院已注册紫东太初大模型商标
对话式论文阅读工具PaperMate上线,综述细节AI告诉你
Snow Kylin登陆中国列车,打造全球首条元宇宙专列
GPT-4 模型架构泄露:包含 1.8 万亿参数、采用混合专家模型
映宇宙数字人“映映”亮相ChinaJoy,展示AI黑科技实现用户互动
朱民:普通人炒股炒不过机器人是很正常的 AI已经能理解市场情绪
2025VR&AR显示技术峰会视频解析: 歌尔光学展示最新一代VR/AR光学模组
人工智能“Aria”现身 Opera浏览器100版本更新:新功能“标签岛”
人工智能在商业中的风险和局限性
无人机协助盐城交通执法的协同训练
DreamAvatar数字人使用教程
360发布AI数字人广场,可同孙悟空、爱因斯坦等古今中外角色对话
大模型新品出现井喷,AI产业迎来新时代
如何用AI重塑你的工作流(一)
抛媚眼给瞎子看?微软、谷歌的AI广告被广告主抵制
Nature封面:量子计算机离实际应用还有两年
GPT-4使用混合大模型?研究证明MoE+指令调优确实让大模型性能超群
智能化解决方案:保障数据安全阻击泄露和丢失
关于开展“与AI共创未来”——2025年全国青少年人工智能创新实践活动的通知