400 128 6709

行业新闻

追平满血版o1的国产多模态模型终于来了!训练细节全部公开

发布时间:2025-01-21点击次数:

春节前夕,一款堪比openai o1完整版(非预览版)的大模型强势来临!月之暗面科技正式发布kimi k系列模型的最新力作——k1.5多模态思考模型。该模型在数学、代码和多模态推理等方面全面超越openai o1预览版,成为openai之外首个达到o1水平的多模态模型。尤其值得一提的是,kimi-k1.5-short模型在短链思维推理测试中取得了sota成绩,大幅领先gpt-4o和claude 3.5 sonnet(提升幅度高达550%)!

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片这是国内首个在数学和代码能力上达到openai o1完整版水平的ai模型。此前,国内模型在基准测试中只能达到o1预览版的水平(50-60分),而o1完整版则达到80-90分,kimi k1.5的成绩令人瞩目。

月之暗面同步公开的技术报告详细阐述了他们在新技术范式下模型训练技术的探索历程。图片

  • 技术报告:Kimi k1.5:基于大语言模型的强化学习扩展
  • 报告链接:https://www.php.cn/link/0f4f778e61d44558c6f448a9cd313b08

在竞争激烈的AI大模型市场,如此高的技术透明度实属罕见。月之暗面表示,他们希望与更多技术人才分享经验,携手推动AGI发展。

Kimi k1.5:各项测试均达SOTA水平

技术报告显示,Kimi k1.5多模态推理模型在推理和通用能力方面达到SOTA水平:在长链思维推理(long-CoT)模式下,其数学、代码和多模态推理能力均达到OpenAI o1完整版的水平。具体分数如下:AIME 77.5分,MATH 500 96.2分,Codeforces 94百分位,MathVista 74.9分。

这是全球范围内,OpenAI以外公司首次实现o1完整版性能。此前模型仅能达到o1预览版或o1精简版的推理能力。图片

在短链思维推理(short-CoT)模式下,Kimi k1.5在数学、代码、视觉多模态和通用能力方面也达到全球SOTA水平,大幅领先GPT-4o和Claude 3.5 Sonnet。例如,其AIME得分为60.8分,MATH500得分为94.6分,LiveCodeBench得分为47.3分。图片

在全球顶级大模型数学和编程竞赛基准测试中,Kimi k1.5的表现同样出色,位列全球第一梯队。图片

Kimi k1.5的训练方法

随着模型规模的扩大,预训练阶段参数扩展带来的收益递减。为了进一步提升模型推理能力和长程问题解决能力,基于强化学习的后期训练将成为下一个突破点[1]。强化学习的扩展为AI持续进步开辟了新维度,它使大语言模型能够通过奖励机制学习来扩展训练数据,从而实现计算规模的扩展。

Kimi技术团队在Kimi k1.5的训练中,全面探索了强化学习训练技术、多模态数据配置和基础设施优化。他们设计的强化学习框架简单高效,无需依赖蒙特卡洛树搜索、价值函数和过程奖励模型等复杂技术,即可取得优异性能。他们还提出了有效的long2short技术,利用长链思维推理技术改进短链思维推理模型,使其在短链思维推理方面取得最佳成果。

Health AI健康云开放平台 Health AI健康云开放平台

专注于健康医疗垂直领域的AI技术开放平台

Health AI健康云开放平台 113 查看详情 Health AI健康云开放平台

简单高效的强化学习框架

该框架的关键在于:长上下文扩展和改进的策略优化。通过将上下文窗口扩展到128k,并利用部分展开技术提高训练效率,他们观察到模型性能随着上下文长度的增加而持续提升。在策略优化方面,他们推导出了一个包含长链思维推理的强化学习公式,并采用在线镜像下降法的变体来实现稳健的策略优化。图片

long2short技术

为了解决长链思维推理模型在测试时token消耗量较大的问题,他们提出了几种long2short方法,包括模型融合、最短拒绝采样、DPO和long2short强化学习。

2025:Kimi系列强化学习模型加速升级

OpenAI在2025年5月和9月推出的GPT-4o和o1模型,分别代表了多模态理解和强化学习两条技术路线。Kimi模型在能力上已逼近o1,令人对月之暗面在2025年的发展充满期待。月之暗面表示,2025年将继续加速升级k系列强化学习模型,提升其模态、领域和通用能力。图片

参考链接:[1] https://www.php.cn/link/e863fb23a124570677ebdd1933876020

以上就是追平满血版o1的国产多模态模型终于来了!训练细节全部公开的详细内容,更多请关注其它相关文章!


# kimi  # 东莞网站优化专家  # seo信息是什么意思  # 国际网站建设费用  # 镇江网站建设方法与技术  # 南通互联网网站优化优势  # b2b网站免费推广平台推荐  # 江苏网站建设规划的论文  # 网站建设三把火  # 首个  # 生命科学  # 长程  # 多家  # 提出了  # 来了  # 预览版  # 这是  # 一言  # 多模  # 2025  # 2025年  # claude  # ai  # qq  # git  # 月之暗面  # 产业  # 武穴网站建设怎么做  # 找网站推广公司的好处 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 码刻 | 48小时Hackathon,源码见证新生代AI创新的发生  AI时代,企业需要什么样的员工?  出门问问亮相2025世界人工智能大会,展示AI CoPilot解决方案  从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级  【澎湃原动力】人工智能产业协同创新中心:全产业链资源在这里汇聚  物联网“僵尸网络DDos攻击”增长惊人,威胁全球电信网络  当TS遇上AI,会发生什么?  AYANEO AIR 1S 掌机发布:R7 7840U,预订价 4699 元起  即将到来:AI婚纱设计软件实际测试,人工智能即将开创婚纱设计新纪元  靠游戏更靠AI 英伟达成唯一首季度两位数增长的公司  百川智能发布Baichuan-13B AI模型,号称“130亿参数开源可商用”  华为云天筹AI求解器荣获世界人工智能大会最高奖  搭载星火认知大模型 讯飞听见智慧屏开启AI办公新体验  郭帆:AI发展日新月异,或是弯道超车好莱坞的最好机会  鸿蒙生态带来了哪些新的流量可能性,包括AI、服务分发和原生智能等方面?  2025年的网络分区:人工智能和自动化如何改变事物  张朝阳陆川谈AI:大数据模型大幅提升工作效率,ChatGPT冲击最大的是内容创作领域  如何利用AI工具写好本科论文:科技助你一臂之力  热点资讯:家乐福推出聊天机器人;米哈游2025年营收273.4亿元…  AI大模型紫东太初已被注册商标 中科院已注册紫东太初大模型商标  亚太地区 70% 的企业高管正探索生成式 AI 应用或已经进行投资  苹果在韩举办首届中小企业智能制造论坛,加速推动工业4.0发展  IBM与NASA联手开源地理空间AI基础模型,促进气候科学领域进步  AI教父Bengio:我感到迷失,对AI担忧已成「精神内耗」!  陈根:AI工具为游戏软件实时3D内容助力  上天下海登极,青岛与昇腾AI握手一起探索星辰大海  NTU、上海AI Lab整理300+论文:基于Transformer的视觉分割最新综述出炉  令人惊叹!AI模型能够以iPhone照片为基础创作诗歌  百亿量化私募:量化投资进入“精耕细作”时代 AI带来行业新变革  华为云发布华为云盘古模型3.0和升腾AI云服务,亮点亮相2025华为开发者大会  击败LLaMA?史上超强「猎鹰」排行存疑,符尧7行代码亲测,LeCun转赞  大疆 Air 3 无人机售价和实物照片曝光  视觉中国推出AI灵感绘图功能  下一个前沿:量子机器学习和人工智能的未来  AI与5G的强强联合:唤醒数字时代的无尽潜能  一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了  美图秀秀“AI 扩图”功能上线,可根据图像生成更大画幅  官宣!爱康AI未来之夜三大亮点提前剧透!  磐镭发布全新 GeForce RTX 4080 ARMOUR 显卡,售价为 9499 元  1.6亿美元收购Singularity AI,昆仑万维布局通用人工智能  国网辉南供电:无人机空中巡检 全力护航端午佳节  苹果头显降临,AI虚拟人的救星还是流星?  新闻传闻:迪士尼可能采用人工智能来控制电影制作成本  大脚攀爬者车主福利!无人机、运动相机大奖等你来挑战  RoboNeo安装教程  世界周刊丨AI“棱镜”?  行业首发「超级智绘」AI故事集,TCL实业推进AI技术应用  用AI升级会议体验!思必驰多款会议产品亮相全球智博会!  看了天美对AI的布局,我感觉它想得是真明白  谷歌旗下 DeepMind 开发出 RoboCat AI 模型,能控制多种机器人执行一系列任务 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司