发布时间:2025-03-04
点击次数: 中国ai新创公司deepseek近来「开源」一波波,上周六 (1日) 又有更大惊喜,全面揭秘deepseek-v3/r1推理系统,不仅公开其推理系统的核心优化方案,更首次披露成本获利率等关键数据,引发产业震动。
DeepSeek上周六在知乎平台发布首条文章,公布模型推理成本利润细节,并披露成本获利率关键资讯,若所有tokens全按DeepSeek-R1的定价计算,理论上一天的总收入为56万2027美元,成本获利率为545%,这一数字刷新全球AI大模型领域的获利天花板。
根据DeepSeek官方披露,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。
在最近24小时 (2025年2月27日12:00至28日12:00) 的统计周期,若 GPU租赁成本按2美元 / 小时计算,日均成本为8万7072美元,而若所有输入 / 输出token按R1定价 (输入1元 / 百万token、输出16元 / 百万 token) 计算,单日收入可达56万2027美元(约1865万新台币),成本获利率高达545%。
MenloVentures投资人Deedy在看完上述数据后指出,获利率超过500%这一商业效率在美国将是一家价值逾百亿美元的公司。
中国硅基流动创办人袁进辉也在第一时间发表了自己的感受说:「DeepSeek官方披露大规模部署成本和收益,又一次颠覆了很多人认知。」
DeepSeek的高获利率源于其创新的推理系统设计,核心包括大规模跨节点专家并行(EP)、计算通信重叠与负载均衡优化三大技术支柱。 EP提升吞吐与回应速度,针对模型稀疏性(每层仅启动8/256个专家),采用EP 策略扩展总体批处理规模,确保每个专家获得足够的计算负载,显著提升GPU利用率,部署单元动态调整 (如Prefill阶段4节点、Decode阶段18 节点),平衡资源分配与任务需求。
简言之,EP就像是「多人协作」,把模型中的「专家」分散到多张GPU上进行计算,大幅提升Batch Size,榨干GPU算力,同时专家分散,降低存储器压力,更快回应。
MedPeer科研绘图
生物医学领域的专业绘图解决方案,告别复杂绘图,专注科研创新
166
查看详情
DeepSeek在工程层面进一步压缩成本,加上昼夜资源调配,白天高峰时段全力支援推理服务,夜间闲置节点转用于研发训练,最大化硬件利用率,缓存命中率达56.3%,通过KVCache硬盘缓存减少重复计算,在输入token中,有3420亿个(56.3%)直接命中缓存,大幅降低算力消耗。
有分析称DeepSeek此次披露的数据,不仅验证其技术路线的商业可行性,更为行业树立高效获利标竿,模型训练成本仅为同类产品的1%至5%,此前发布的DeepSeek-V3模型训练成本仅557.6万美元,远低于OpenAI等巨头。在推理定价优势方面,DeepSeek-R1的API定价仅为OpenAI o3-mini的七分之一到一半左右,低成本策略加速市场渗透。
还有分析指出,DeepSeek此次「透明化」披露不仅展示其技术实力与商业潜力,更向行业传递明确信号,也就是AI大模型的获利循环已从理想照进现实,代表AI技术从实验室迈向产业化的关键转折。
不过,DeepSeek官方坦言实际上没有这么多收入,因V3定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。
中信证券认为,Deepseek在模型训练成本降低方面的最佳实践,料将刺激科技巨头采用更经济方式加速前沿模型的探索和研究,同时将使得大量AI应用得以解锁和落地。演算法训练带来的规模报酬递增效应,以及单位算力成本降低对应的杰文斯悖论等,均代表中短期维度科技巨头继续在AI算力领域进行持续、规模投入仍将是高确定*件。
以上就是545%! DeepSeek首披露成本利润率 专家:若在美国已是一家价值逾百亿美元公司的详细内容,更多请关注其它相关文章!
# 中国
# 盐城正规seo推广机构
# 百度排名优化长尾词seo网站
# 怀柔网站优化关键词
# seo从零开始学引流
# 广州搜索矩阵seo
# 大同市环卫网站建设
# 如何优化并发访问网站
# 江干区网站优化报价服务
# 深圳制造业关键词排名
# 泛目录网站怎么优化
# 如何用
# deepseek
# 怎么做
# 在美国
# 负载均衡
# 已是
# 仅为
# 将是
# 会议纪要
# 这一
# 2025
# 2025年
# ai
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
日本学校探索引入 AI 和无人机:提高安保效率,节省劳动力
到中国科技馆体验“一滴油的奇妙旅行”,线上元宇宙展厅同步开启
人工智能改变网络安全和用户体验的三种方式
十个AI算法常用库J*a版
IBM与NASA联手开源地理空间AI基础模型,促进气候科学领域进步
消息称苹果 iPhone 15 系列健康应用将深度融合 AI 技术
联通发布鸿湖图文AI大模型1.0,可实现以文生图
【|直播|预告】人工智能高峰论坛将于7月2日13:30准时开播!
“世界上最像人的机器人”接入 Stable Diffusion ,现场完成作画
发布最新版本的 PICO OS 5.7.0:支持VR头盔录屏并跨平台分享至微信
谷歌推出 AI 反洗钱工具,可将金融机构内部风险预警准确率提高2至4倍
物联网“僵尸网络DDos攻击”增长惊人,威胁全球电信网络
人工智能时代的科幻译者怎么办?“做好翻译工作的高端10%”|文化观察
让AI助手带您轻松愉快地享受写作之旅
大厂出品!这个AI网站太顶了,所有功能免费用
世界周刊丨AI“棱镜”?
多家欧洲企业签署公开信,批评欧盟 AI 法案草案限制产业发展
厂商陆续公布AI进展 完美世界游戏展示复合应用AI in GamePlay
统信深度deepin成立 AI SIG 社区,共同提升 Linux 下 AI 体验
微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
生活垃圾智能分类机器人社区展“才能”,征求居民意见
360°/180°双模式,佳能公布可折叠小体积的VR全景相机
“一般智力”与工艺学批判是认识AI的重要入口 | 社会科学报
周鸿祎参加中美青年科技创新峰会,分享人工智能创新机遇
讯飞听见会写“会议摘要”功能全面升级,AI更懂你的关注点
百亿量化私募:量化投资进入“精耕细作”时代 AI带来行业新变革
美图设计室2.0什么时候上线
美踏控股推出创新人工智能大数据模型“心乐舞河”:虚拟人音舞社交的新体验
机智云AI离线语音识别模组,让家电变得更加智能便捷
世界人工智能大会高合发表演讲,HiPhi Y即将全球上市
Midjourney创始人:AI应该成为人类思想的延伸
清华&中国气象局大模型登Nature:解决世界级难题,「鬼天气」预报时效首次达3小时
抖音在Android平台获得VR|直播|软件著作权
马斯克预测:特斯拉全自动驾驶将在今年实现 对AI深度变化感到担忧
微软在德国举办MR研讨会,向女性分享元宇宙潜力
陈丹琦ACL学术报告来了!详解大模型「*」数据库7大方向3大挑战,3小时干货满满
云米Smart 2E AI立式空调开启预售:新三级能效,到手价3899元
干货满满,2025昆山元宇宙国际装备展等你来打卡!
一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了
通用医疗人工智能如何革新医疗行业?
常见的五个人工智能误解
Xbox游戏工作室负责人:VR/AR领域的用户规模还不足够
美图公司吴欣鸿:AI技术重构影像产业
智能手机应用中的人工智能的重要性
特斯拉首发人形机器人“擎天柱”亮相世界人工智能大会
重磅! 捷通华声灵云AICC荣获第二届光合组织AI解决方案大赛二等奖
280万条多模态指令-响应对,八种语言通用,首个涵盖视频内容的指令数据集MIMIC-IT来了
英伟达H100霸榜权威AI性能测试 11分钟搞定基于GPT-3的大模型训练
机构:边缘AI或是当前预期差最大的AI方向
Meta 为打造元宇宙不惜下血本:VR 开发者年薪高达百万美元