400 128 6709

行业新闻

历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月

发布时间:2025-02-07点击次数:
开源 AI 世界的里程碑事件!

我们正在见证历史:DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。

截至本周五下午两点,DeepSeek 旗下热度最高的项目 DeepSeek-V3 大模型 Star 量已达 7.77 万,超越了同平台中 OpenAI 最热门项目。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片
                             DeepSeek 项目的星数还在以肉眼可见的速度增长。

去年 12 月 26 日,DeepSeek AI 开源了其最新混合专家(MoE)大语言模型 DeepSeek-V3,它立即成为通用语言模型的性能标杆,受到了全球 AI 社区热议。

DeepSeek-V3 模型引入了动态注意力机制(Dynamic Attention Mechanism),通过实时调整注意力权重优化文本生成质量。其 MoE 架构共包含 6710 亿参数,但每 Token 仅激活 370 亿参数,大幅降低了计算成本,训练成本仅为同类闭源模型的 1/20。

据技术报告介绍,DeepSeek-V3 的预训练过程只花费 266.4 万 H800 GPU Hours,再加上上下文扩展与后训练的训练共为 278.8 H800 GPU Hours(训练成本 557.6 万美元)。相较之下,Llama 3 的训练预算约为 3930 万 H100 GPU Hours。
图片
                                  图源:https://arxiv.org/pdf/2412.19437

随后在 1 月 23 日,DeepSeek 以 V3 为基础使用强化学习(Reinforcement Learning)驱动重构训练范式,提出了 DeepSeek-R1,彻底改变了开源 AI 世界。

DeepSeek R1 性能完全对标 OpenAI o1,与 DeepSeek V3 相比性能有大幅提升,其论文指出纯强化学习可以赋予 LLM 强推理能力,而无需大量监督微调,震动了 AI 业界。

从技术角度来看,DeepSeek 展示了国内科研团队的创新能力,并在 Scaling Laws 之后揭开了大模型发展的新范式,大幅降低了 AI 对算力的依赖,并用自我进化的方式平衡了数据优势。

R1 还支持将推理能力迁移至更小模型,为边缘计算和即时应用开辟了大量的可能性。
图片
由于 OpenAI 自 GPT-3 起并未开源其基础 AI 大模型,目前 OpenAI 的热门开源项目包括 openai-cookbook,即使用 OpenAI API 完成常见任务的示例代码和指南;以及 Whisper,这是一个 2025 年 9 月开源的通用语音识别模型。

除此之外,同属开源大模型的 Llama 系列最高星数达到了 5.75 万,阿里云的 Qwen2.5 有 1.49 万 Star,零一万物的 Yi 有 7800 Star。
图片
DeepSeek V3 和 R1 的推出仿佛为全球大模型社区打了一针强心剂,在 AI 研究领域,围绕 R1 核心强化学习方法 GRPO 的进一步研究已经出现。

DeepSeek 开源的策略也为应用创造了大量机会。目前虽然 DeepSeek App 官方报告正在受到高频次网络攻击,但仅在国内就有阿里云、华为云、腾讯云、百度智能云、360 数字安全、云轴科技等多个平台宣布上线了 DeepSeek 大模型,方便各路开发者调用。

在海外,英伟达、亚马逊和微软云服务也宣布接入了 DeepSeek R1。

DeepSeek 系列模型被公认为是目前最先进的大语言模型之一,随着技术开源的推动,我们或许将见证生成式 AI 更快的发展。

以上就是历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月的详细内容,更多请关注其它相关文章!


# 多家  # 丽江品牌网站建设推广  # 辽宁抖音图文seo  # 推广有钱赚的网站  # 宿迁seo服务  # 广西营销推广途径有哪些  # 珠海免费建设网站  # 网站建设流程有哪几步  # 榆林seo排名哪里好  # 玉门网站建设公司  # 台州网站建设网络推广公司  # 祝福语  # 亚马逊  # 内测  # 生命科学  # 两个月  # 产业  # 重构  # 腾讯  # 一言  # 开源  # dee  # b12  # llama  # qwen  # red  # 腾讯云  # 百度  # ai  # qq  # git  # deepseek 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: XREAL发布新款硬件XREAL Beam投屏盒子:可悬停AR空间屏  Meta推出VR订阅服务Quest +:每月免费玩两款游戏,7.99美元/月  大脚攀爬者车主福利!无人机、运动相机大奖等你来挑战  用AI技术点亮老照片:Deep Nostalgia带给照片新生动感  DreamAvatar数字人使用教程  探展WAIC |万向区块链杜宇:不存在单一技术的iPhone时刻,Web3.0核心将基于AI+区块链+物联网  中国联通发布图文AI大模型,可实现以文生图、视频剪辑  WPS AI 官网上线:可申请体验官资格,支持 Windows、安卓端下载  华为发布大模型时代AI存储新品  到中国科技馆体验“一滴油的奇妙旅行”,线上元宇宙展厅同步开启  科普:什么是AI大模型  消息称苹果 iPhone 15 系列健康应用将深度融合 AI 技术  机器人技能大比拼  美图开拍使用教程  IBM CEO克里希纳:人工智能潜在创新无法被监管  Snow Kylin登陆中国列车,打造全球首条元宇宙专列  磐镭发布全新 GeForce RTX 4080 ARMOUR 显卡,售价为 9499 元  埃森哲俞毅:AI时代我们需要新的“摩尔定律”  美图公司:Wink国内首发AI画面拓展功能  搭载星火认知大模型 讯飞听见智慧屏开启AI办公新体验  微软向美国政府提供GPT大模型,如何保证安全性?  探索人工智能在物联网领域的影响与改变  人脸识别+全景双摄+AI算法 萤石推动智能锁行业革新  微软bing聊天推出AI购物工具 可进行比价并查看历史最低价  OpenAI限制网络爬虫访问以保护数据免被用于AI模型训练  复盘MWC上海:AI大模型时代到来 通信网络将会怎样改变?  网易云音乐内测上线“私人DJ” 打造AI推荐音乐助手  Hugging Face发布了基于NASA卫星数据构建的AI地理空间基础模型  6月14日《星空下的对话》 张朝阳陆川将畅聊人生、电影、心理学与AI  首部国内AI辅助动画片《魔游纪:人工智能辅助篇》预告发布  腾讯机器狗进化:通过深度学习掌握自主决策能力  昇思开源社区理事会成立,基于昇思AI框架的全模态大模型“紫东.太初2.0”发布  中国气象局预测:到 2030 年,中国人工智能气象应用将达到国际领先水平  ​布局智能物联新时代,中国移动“5G+物联网”亮相2025 MWC  ChatGPT设计出的第一个机器人来了!【附人工智能行业预测】  美图公司影像节或发布AI设计新品  清华&中国气象局大模型登Nature:解决世界级难题,「鬼天气」预报时效首次达3小时  人形机器人概念大热!这些产业链标的或受提振  Unity发布Sentis和Muse AI工具,助力创作游戏和3D内容  闪电快讯|京东推出言犀AI大模型 面向零售、医疗、物流等产业场景  亚马逊确认今年不举办re:MARS人工智能大会  创作音乐/音频的Meta开源AI工具AudioCraft,让用户通过文本提示实现  Win11 的画图应用将包含 Windows Copilot 的 AI 工具整合  苹果推出全新沉浸式 AR 体验应用“Deep Field”  Zoom远程会议应用:AI培训需经用户授权  联想创投携手12家被投企业MWC展示元宇宙、机器人等技术  大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务  DragGAN开源三天Star量23k,这又来一个DragDiffusion  人工智能在重症监护室的未来  挤爆服务器,北大法律大模型ChatLaw火了:直接告诉你张三怎么判 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司