发布时间:2024-03-08
点击次数: 大模型竞赛,又杀出一匹黑马——
Inflection-2.5,由DeepMind联创Mustafa Suleyman的大模型初创公司打造。
只用40%的计算资源训练,表现就超过了GPT-4的九成,尤其擅长代码和数学。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
而早期的Inflection模型,训练时只消耗了4%的计算资源,就达到了GPT-4表现的72%。
以Inflection模型为基础,该公司还推出了网页端对话机器人Pi,主打“高情商”和“个性化”,还支持中文。
自诞生以来,Pi的最高日活达到了100万,累计产生了40亿条消息,平均对话时长来到了33分钟。
而随着这次基础模型的升级,Pi也迎来了它的新版本。
图片
那么,Inflection,或者说Pi,表现到底有没有那么强,量子位进行了一番实测。
打开Pi的页面,映入眼帘的是这样一个极简界面,而且还可以不用登录,直接点击Next。
图片
连续Next几次后,输入希望Pi称呼我们的方式。
图片
之后是选择声音和推荐话题,直接跳过就可以了,然后就进入正式的聊天界面了。
图片
简单测试发现,Pi支持中文对话,既然如此那就先把弱智吧Benchmark给安排上。
第一题,老鼠生病了可以吃老鼠药治好吗,Pi成功解答。
图片
再来一道“陷阱”题,这次依旧没有上当。
图片
两道问题过后,虽然没有出现什么戏剧性效果,但看起来对中文也是有一定的理解了。
接下来就重点看看官方宣称“尤其擅长”的数学和代码能力。
首先是一道涉及动态规划的编程题目。
图片
Pi给出的代码成功解决了这个问题,并且配有清晰的解释。
图片
接下来再提升一下难度看看,让其分析一个数字的阶乘中末尾有多少个0。
图片
Pi给出的代码不仅正确,而且简洁高效,运行速度超过了LeetCode上73.8%的用户。
图片
最后再来增加一下难度,以一道47.5%通过率的题目结束代码部分的测试。
Machine Translation
聚合多个来源的AI翻译
49
查看详情
图片
看完代码,再来测测Pi的数学能力怎么样,让它做做关于导数的题目:
求出函数f(x)=x³+2x²-1的极值点
解答完全正确,而是十分详细。
当然要想数学好,逻辑思维是必不可少的,所以我们在常规的数学题之外,又用一道经典的题目考验了一下的Pi逻辑思维,结果还不错。
通过Pi的表现,可以看出其背后的Inflection-2.5模型的确可圈可点。
而从官方自己公布的测试数据来看,无论是综合能力还是各个子项,Inflection-2.5的表现都紧随
GPT-4。
以数学和代码为例,Inflection-2.5在MATH、HumanEval等测试中都比1.0版本都有大幅飞跃。
在这些常规的数据集之外,Inflection还挑战了匈牙利高考数学试题和GRE物理测试,结果几乎与GPT-4打成平手。
更“刁钻”的,还有人专门用大模型难以理解的问题构建了一个BIG-Bench数据集,而Inflection-2.5挑战了其中的Hard子集,结果和GPT-4的差距不到一分。
那么,Inflection-2.5的背后,是怎样的一家公司呢?
这家公司名叫Inflection AI,由DeepMind联创Mustafa Suleyman等人于2025年创立,目前共有70余人。
同样来自DeepMind的,还有资深研究员Karen Simonyan,现担任Inflection AI的首席科学家。
此外,LinkedIn联创Reid Hoffman也参与了Inflection AI的创立。
创立以来,Inflection AI已经获得了来自英伟达、微软、比尔盖茨等巨头的共计15亿美元的融资。
目前,基于Inflection的Pi还是免费的,但CEO Suleyman也表示,一直用爱发电不现实,长久地看以后还是要收费。
想要体验的朋友,可能要抓紧时间了~
传送门:https://pi.ai
以上就是40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果的详细内容,更多请关注其它相关文章!
# 训练
# 匈牙利
# 开源
# 中国
# 上海
# 逻辑思维
# 求出
# 丰田
# 中国科学院
# 再来
# 联创
# 模型
# 河南金建建设集团网站
# 名优网站建设收费
# xiuno seo插件
# 西安邮件推广网站
# SEO是网站编辑外链
# 网站建设营销正在直播
# seo工程师网站招聘
# 研学怎么做营销推广的
# 铁岭seo营销电话多少
# 广东网站建设前的分析
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
能源电力数字化转型恰逢其时
支持跨语言、人声狗吠互换,仅利用最近邻的简单语音转换模型有多神奇
MiracleVision视觉大模型功能介绍
AI生成新闻网站数量激增,正在疯狂赚取广告收入
1.6亿美元收购Singularity AI,昆仑万维布局通用人工智能
「社交达人」GPT-4!解读表情、揣测心理全都会
2025VR&AR显示技术峰会展示歌尔光学最新一代光学模组
如何对员工进行再培训以充分利用供应链管理中的人工智能创新
对话无界AI创始人长铗:AI的创业机会在应用层丨创新者Innovator
烟台大学学生首次在全国大学生无人机航拍竞赛中获奖
Prompt解锁语音语言模型生成能力,SpeechGen实现语音翻译、修补多项任务
WHEE使用教程
智能化解决方案:保障数据安全阻击泄露和丢失
马斯克嘲讽人工智能:机器学习本质就是统计学
彬州市第三届青少年机器人创新大赛成功举办
人工智能在重症监护室的未来
AI 作画工具 Midjourney 推出“pan”功能,可平移扩展图片外场景
百度文心一言App上架苹果商店,人工智能创作引发热议
组建团队,字节跳动要造机器人?
喜马拉雅在国际会议挑战赛中突破语音重叠难题斩获第一 加速AI创新
调查显示:实际上没有那么多人在用 ChatGPT
WHEE安装教程
工业机器人及非标自动化设备集成服务提供商
微软商店 AI 摘要功能开启预览,帮助用户迅速了解应用评价
亲身体验鸿蒙4:AI大模型带来的便利,告别单纯的旁观者状态
世界周刊丨AI“棱镜”?
特斯拉门店可能启动机器人卖车?也许不是你想的那样
尼康尼克尔Z 180-600mm f/5.6-6.3 VR镜头发布:12499元 拍鸟神器
优化J*a与MySQL合作:分享批处理操作的技巧
“图壤·阅读元宇宙”亮相北京国际图书博览会
Win11 的画图应用将包含 Windows Copilot 的 AI 工具整合
腾讯汤道生:大模型只是起点,产业落地是AI更大的应用场景
以分布式网络串联闲置GPU,这家创企称可将AI模型训练成本降低90%
微软bing聊天推出AI购物工具 可进行比价并查看历史最低价
探索AI前沿理念 2025全球人工智能技术大会在杭州开幕
美的推出 AI 双视精准避障的自动集尘扫拖机器人 V12,售价仅为2999元
2025世界人工智能大会(上海)开幕式纪要
从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级
谷歌旗下 DeepMind 开发出 RoboCat AI 模型,能控制多种机器人执行一系列任务
月薪6万,哪些AI岗位在抢人?
百度创始人、董事长兼首席执行官李彦宏:AI原生应用比大模型数量更重要
AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真
人工智能改变网络安全和用户体验的三种方式
再也不怕「视频会议」尬住了!谷歌CHI顶会发布新神器Visual Captions:让图片做你的字幕助手
“世界上最像人的机器人”接入 Stable Diffusion ,现场完成作画
当一个网站的内容被 AI 完全接管
令人震惊的特斯拉机器人
人工智能和神经网络有什么联系与区别?
科技赋能司法执行 阿里资产免费为全国法院升级VR新服务
真全息产品,亮相深圳文博会——dipal数伴拓展元宇宙非沉浸式体验