发布时间:2024-05-25
点击次数: 近日,豆包大模型在火山引擎原动力大会上正式发布。以超低价格促销大模型降价潮的同时,豆包的模型能力也引发行业关注。
在火山引擎的一份产品资料中,豆包模型团队发布了一期内部部分测试结果:在 MMLU、BBH、GSM8K、HumanEval 等11个行业主流的公开评测集上,Doubao-pro-4k 的总分为76.8分,相比上一代模型云雀Skylark2 的64.5分提升了19%。这也优于同期测试的其他国产模型。
此次评测在今年5月完成,主要包括豆包括通用模型Pro、云雀Skylark2以及内的九款国产大语言模型。除了云雀Skylark2以外,其他模型均为各家厂商最新发布的高级版本,通过API调用进行测试。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图:豆包模型团队内部测试结果
根据评测结果显示,在评估代码能力的两个评测集"HumanEval"和"MBPP"上,豆包相比上一代模型提升了50%左右;在专业知识和指令遵循的评测集上,豆包分别获得33%和24%的性能提升,同时也是得分最高的国产模型。
除了数学能力、语言理解能力,以及综合评测集BCMMLU和CEval的评测上也有不错的表现。得分排在前三。综合11个公开评测集上的测试成绩,豆包通用模型-pro的总分为76.8分。根据OpenAI公布的测试成绩,GPT-4在这些评测集上的总分为80.1分,相比国产模型仍有一定领先优势。
灵感PPT
AI灵感PPT - 免费一键PPT生成工具
308
查看详情
据悉,豆包模型于5月15日刚刚推出,尚未加入到第三方机构测试中。预计未来一到两个月内,很多第三方评测机构将会陆续披露该模型的评测结果。与模型同名的AI助手"豆包",官方公布的月活用户数已经达到2600万,用户可以自由体验测试。
此前,智源研究院公布了覆盖全球91个语言模型的评测报告。在偏重考察中文能力的主观评测中,云雀Skylark2排名第一,中文能力超过GPT-4。

图:智源研究院语言模型评测结果(模型为4月20日之前的版本)
以上就是豆包大模型披露评测成绩,较上一代“云雀”提升19%的详细内容,更多请关注其它相关文章!
# api调用
# 豆包大模型
# 产业
# seo文章简历
# 定制店铺营销推广计划app
# 东莞地产网站seo优化
# 大连珠宝行业网站推广
# 什么程序适合做seo
# 宁乡视频营销推广排名
# SEO学习软件免费
# 广安专业的网站建设价格
# 四川关键词seo排名优化
# 懂小明seo博客
# 领跑
# 固定资产
# 中国
# 下月
# 两周
# 大比拼
# 三季度
# 广州
# 量产
# 丰田
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
大模型的“黄金搭档”来了!腾讯云正式发布AI原生向量数据库,提供10亿级向量检索能力
OpenAI 静默关闭 AI 文本检测工具,准确率仅为 26%
元宇宙技术带你穿梭“大运河”,江苏书展上的数字阅读馆吸睛小读者
调研海尔智家:AI名,家电命?
数字彩排、虚拟建厂!这家顶级洗衣机工厂敲开“工业元宇宙”之门
助力人工智能产业高质量发展 龙岗区算法训练基地正式启用
AI智能室内效果图设计软件效果,确实惊到我了!
特斯拉人形机器人将亮相 预计售价不超过15万元
DreamAvatar数字人在哪里下载
“黑科技”亮相大湾区轨交论坛 智慧交通迈向“强AI”
生成式人工智能进入产业应用!但再“聪明”仍是工具,最终目的是服务于人
“痴迷”元宇宙,魔珐科技想做什么?
人工智能赋能无人驾驶:商业化进程再提速
AI拉动PCB发展|行业发现
《上古卷轴5》AI高清材质包优化游戏中所有怪物
基于信息论的校准技术,CML让多模态机器学习更可靠
京东 AI 大模型官宣 7 月 13 日发布,还有重磅合作
科技有狠活|时光修复师 :用AI让昨日重现
AI大模型,将为智慧城市带来哪些新变化?
世界周刊丨AI“棱镜”?
酒店业将如何受益于人工智能的改变?
当一个网站的内容被 AI 完全接管
VR健身应用《FitXR》将取消Quest 1端会员服务
苹果AIGC专利:可通过语音指令生成AR/VR虚拟场景
人工智能改变网络安全和用户体验的三种方式
机器人加速!稀土永磁也被带火,持续性如何?
如何获得元宇宙的第一个属于自己的空间
焊接协作机器人或将成为26届埃森展最大看点
中国联通发布图文AI大模型,可实现以文生图、视频剪辑
优化J*a与MySQL合作:分享批处理操作的技巧
人工智能在交通领域的革新:智能解决方案彻底改变交通方式
OpenAI高管:AI能创造新的就业机会 但也会淘汰一些
纪录片 《寻找人工智能》全集1080P超清
Vision Pro头显重磅发布;苹果收购AR厂商Mira
标贝科技亮相国际顶会ICASSP2025 加速布局海外AI数据市场
XREAL发布新款硬件XREAL Beam投屏盒子:可悬停AR空间屏
Bing 聊天机器人现支持在桌面端用语音提问
这效果能打几分?AI真人化《名侦探柯南》
无人机自主巡检为高海拔输电线路运维添“新彩”
眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷
探展WAIC |万向区块链杜宇:不存在单一技术的iPhone时刻,Web3.0核心将基于AI+区块链+物联网
12页线性代数笔记登GitHub热榜,还获得了Gilbert Strang大神亲笔题词
如何成功实施人工智能?
硅谷人工智能研究院创始人皮埃罗·斯加鲁菲:Transformer模型演讲
最大助力35公斤 外骨骼机器人或在养老、医疗领域“大展身手”
AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真
科学家称,面对人工智能,人类未来或只有灭亡与虚拟永生两个选择
百度举办AIGC创作沙龙,现场传授AI绘画“咒语”技巧
优傲机器人的人机协作技术 助力中小企发展
大疆 Air 3 无人机售价和实物照片曝光