400 128 6709

行业新闻

豆包大模型披露评测成绩,较上一代“云雀”提升19%

发布时间:2024-05-25点击次数:

近日,豆包大模型在火山引擎原动力大会上正式发布。以超低价格促销大模型降价潮的同时,豆包的模型能力也引发行业关注。

在火山引擎的一份产品资料中,豆包模型团队发布了一期内部部分测试结果:在 MMLU、BBH、GSM8K、HumanEval 等11个行业主流的公开评测集上,Doubao-pro-4k 的总分为76.8分,相比上一代模型云雀Skylark2 的64.5分提升了19%。这也优于同期测试的其他国产模型。

此次评测在今年5月完成,主要包括豆包括通用模型Pro、云雀Skylark2以及内的九款国产大语言模型。除了云雀Skylark2以外,其他模型均为各家厂商最新发布的高级版本,通过API调用进行测试。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

豆包大模型披露评测成绩,较上一代“云雀”提升19%

图:豆包模型团队内部测试结果

根据评测结果显示,在评估代码能力的两个评测集"HumanEval"和"MBPP"上,豆包相比上一代模型提升了50%左右;在专业知识和指令遵循的评测集上,豆包分别获得33%和24%的性能提升,同时也是得分最高的国产模型。

除了数学能力、语言理解能力,以及综合评测集BCMMLU和CEval的评测上也有不错的表现。得分排在前三。综合11个公开评测集上的测试成绩,豆包通用模型-pro的总分为76.8分。根据OpenAI公布的测试成绩,GPT-4在这些评测集上的总分为80.1分,相比国产模型仍有一定领先优势。

灵感PPT 灵感PPT

AI灵感PPT - 免费一键PPT生成工具

灵感PPT 308 查看详情 灵感PPT

据悉,豆包模型于5月15日刚刚推出,尚未加入到第三方机构测试中。预计未来一到两个月内,很多第三方评测机构将会陆续披露该模型的评测结果。与模型同名的AI助手"豆包",官方公布的月活用户数已经达到2600万,用户可以自由体验测试。

此前,智源研究院公布了覆盖全球91个语言模型的评测报告。在偏重考察中文能力的主观评测中,云雀Skylark2排名第一,中文能力超过GPT-4。

豆包大模型披露评测成绩,较上一代“云雀”提升19%

图:智源研究院语言模型评测结果(模型为420日之前的版本)

以上就是豆包大模型披露评测成绩,较上一代“云雀”提升19%的详细内容,更多请关注其它相关文章!


# api调用  # 豆包大模型  # 产业  # seo文章简历  # 定制店铺营销推广计划app  # 东莞地产网站seo优化  # 大连珠宝行业网站推广  # 什么程序适合做seo  # 宁乡视频营销推广排名  # SEO学习软件免费  # 广安专业的网站建设价格  # 四川关键词seo排名优化  # 懂小明seo博客  # 领跑  # 固定资产  # 中国  # 下月  # 两周  # 大比拼  # 三季度  # 广州  # 量产  # 丰田 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 大模型的“黄金搭档”来了!腾讯云正式发布AI原生向量数据库,提供10亿级向量检索能力  OpenAI 静默关闭 AI 文本检测工具,准确率仅为 26%  元宇宙技术带你穿梭“大运河”,江苏书展上的数字阅读馆吸睛小读者  调研海尔智家:AI名,家电命?  数字彩排、虚拟建厂!这家顶级洗衣机工厂敲开“工业元宇宙”之门  助力人工智能产业高质量发展 龙岗区算法训练基地正式启用  AI智能室内效果图设计软件效果,确实惊到我了!  特斯拉人形机器人将亮相 预计售价不超过15万元  DreamAvatar数字人在哪里下载  “黑科技”亮相大湾区轨交论坛 智慧交通迈向“强AI”  生成式人工智能进入产业应用!但再“聪明”仍是工具,最终目的是服务于人  “痴迷”元宇宙,魔珐科技想做什么?  人工智能赋能无人驾驶:商业化进程再提速  AI拉动PCB发展|行业发现  《上古卷轴5》AI高清材质包优化游戏中所有怪物  基于信息论的校准技术,CML让多模态机器学习更可靠  京东 AI 大模型官宣 7 月 13 日发布,还有重磅合作  科技有狠活|时光修复师 :用AI让昨日重现  AI大模型,将为智慧城市带来哪些新变化?  世界周刊丨AI“棱镜”?  酒店业将如何受益于人工智能的改变?  当一个网站的内容被 AI 完全接管  VR健身应用《FitXR》将取消Quest 1端会员服务  苹果AIGC专利:可通过语音指令生成AR/VR虚拟场景  人工智能改变网络安全和用户体验的三种方式  机器人加速!稀土永磁也被带火,持续性如何?  如何获得元宇宙的第一个属于自己的空间  焊接协作机器人或将成为26届埃森展最大看点  中国联通发布图文AI大模型,可实现以文生图、视频剪辑  优化J*a与MySQL合作:分享批处理操作的技巧  人工智能在交通领域的革新:智能解决方案彻底改变交通方式  OpenAI高管:AI能创造新的就业机会 但也会淘汰一些  纪录片 《寻找人工智能》全集1080P超清  Vision Pro头显重磅发布;苹果收购AR厂商Mira  标贝科技亮相国际顶会ICASSP2025 加速布局海外AI数据市场  XREAL发布新款硬件XREAL Beam投屏盒子:可悬停AR空间屏  Bing 聊天机器人现支持在桌面端用语音提问  这效果能打几分?AI真人化《名侦探柯南》  无人机自主巡检为高海拔输电线路运维添“新彩”  眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷  探展WAIC |万向区块链杜宇:不存在单一技术的iPhone时刻,Web3.0核心将基于AI+区块链+物联网  12页线性代数笔记登GitHub热榜,还获得了Gilbert Strang大神亲笔题词  如何成功实施人工智能?  硅谷人工智能研究院创始人皮埃罗·斯加鲁菲:Transformer模型演讲  最大助力35公斤 外骨骼机器人或在养老、医疗领域“大展身手”  AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真  科学家称,面对人工智能,人类未来或只有灭亡与虚拟永生两个选择  百度举办AIGC创作沙龙,现场传授AI绘画“咒语”技巧  优傲机器人的人机协作技术 助力中小企发展  大疆 Air 3 无人机售价和实物照片曝光 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司