发布时间:2025-12-03
点击次数: 又到年末复盘季啦!本文将带大家回顾我所在团队今年在大模型领域的技术演进路径与落地实践。
大模型的爆发,催生了众多实用型AI应用,其中最主流、最贴近业务场景的当属 RAG(Retrieval-Augmented Generation,检索增强生成)。然而,在短短不到三年时间里,RAG 在技术圈经历了数次“沉浮”:
——刚被寄予厚望,转眼就被预言将被 GraphRAG 取代;
——还没站稳脚跟,又被称“大模型原生能力已覆盖 RAG”;
——长上下文风头正盛时,RAG 被断言“即将退场”;
——紧接着上下文工程又成新宠……
最近 DeepSeek-OCR 的发布,更引发了业内对当前纯文本驱动的 RAG 架构是否仍具可持续性的深度反思。
但就我们一线落地经验来看,RAG 依然是当前企业级大模型应用中不可替代的底层能力。与此同时,我们也越来越清晰地意识到:仅靠传统 RAG 已远远无法应对日益复杂的用户需求。本文将系统介绍我们如何从基础 RAG 出发,逐步迈向更智能、更自主的 DeepResearch 技术体系。
话不多说,先看整体技术演进图谱:
descript1. RAG知识库检索大模型底座的研发门槛极高,在绝大多数 AI 项目中,团队更务实的选择是:如何高效、稳定地用好现有大模型。
这自然将优化重心聚焦于两个关键环节:
输入优化:即 Prompt 工程 / 上下文工程;
输出治理:确保大模型输出更精准、更可控、更符合业务预期。
暂且抛开 Agent 框架中的规划、工具调用、记忆与反思等高级能力,单看单轮问答这一最基础交互形态——无论叫 Prompt Engineering 还是 Context Engineering,本质都是同一个问题:我们该给大模型喂什么内容,它才能真正理解意图,并给出高质量答案?
通用知识,大模型已基本掌握;但要让它懂“你的业务逻辑”,答出“你关心的问题”,就必须构建专属的知识资产,并通过 RAG 实现精准注入。换言之,RAG 就是最直接、最有效的输入增强手段。
关于 RAG 的基础原理与实现细节,我在过往多篇文档中已有详述,此处不再赘述。
(RAG,真是让我们熬过不少通宵……模型不是“降智”就是“幻觉”,RAG 往往成了背锅侠)
结合我们在打造企业级 RAG 知识库问答平台过程中的实战体会:召回、检索、大模型生成等核心模块的技术方案已相对成熟。但在真实落地阶段,算法团队面临的挑战早已远超模型本身——数据质量、治理标准、工程链路稳定性,甚至原始数据的完整性,都可能成为瓶颈。
尤其在垂直领域,我们仍需基于行业特有数据开展模型微调与定制化优化,并针对性攻克实际问题。例如:
关键能力模块如下图所示:
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
descript再分享几点 RAG 落地过程中的关键认知:
管理层的战略定力:企业真正迈向 AI 原生,首要前提是推动数据入口统一、治理流程标准化,而这离不开高层的坚定支持与资源投入。
跨职能协同机制:从业务需求梳理、非结构化数据清洗、语义结构重构、文档规范制定,到版面解析、向量化入库等环节,前期必须由算法与业务团队高频对齐、深度共建。
持续迭代思维:切勿幻想“一次治理、永久可用”。RAG 平台的效果提升,本质上是一场贯穿全生命周期的数据+算法共进化过程——每一次上线、每一条用户反馈,都是打磨知识体系与模型能力的宝贵契机。
RAG 的引入,不只是让企业“用上 AI”,更是触发其启动数据资产化治理、知识图谱化重构的关键起点。而 RAG 自身,也在真实业务压力下不断进化:变得更稳健、更聪明,也更适配多样化业务诉求。
RAG 是知识库问答的标配能力,但在用户真实提问中,我们发现大量问题既不在预置模型能力范围内,也不在内部知识库中,而是强依赖实时网络信息,比如:“最近武汉有哪些热门演唱会?”——这类用户,我们当然不能放弃。
因此,我们构建了一套实时 Web 检索能力,将互联网作为动态知识源,使模型可在必要时按需获取最新资讯。从架构角度看,只需在原有 RAG 流程中新增一个外部检索通道,无需重构主链路。
既然“搜”已打通,那“推”岂能缺席?我们顺势开发了每日热点文章 & 最新顶会论文自动抓取与摘要生成模块,大幅减少人工信息筛选成本。没想到该功能上线后迅速在多个技术团队走红——在信息爆炸时代,AI 主动识别并推送高价值内容,才是真正体现其生产力价值的时刻。
下图是我们为算法同事每日推送的 AI 行业前沿简报界面。该机制并不局限于技术领域,任务类型可根据不同业务线灵活配置。
descript同时,这套 Web 检索结果可无缝接入 RAG 流程,直接支持与网页内容的深度问答交互。
随着工具能力持续丰富、平台使用规模稳步增长,我们愈发明确一个事实:仅具备基础“检索”能力的 RAG 系统,已难以支撑更高阶的业务诉求。
当信息源愈加多元、问题愈加复杂,“单次检索 + 浅层推理”的范式极易止步于表层答案。为此,我们开始向纵深突破——正式开启深度检索(Deep Search)能力建设。
这并非我们独有的挑战,而是整个 RAG 应用生态正在共同演进的方向,如通义 DeepResearch Agent 即为代表性探索之一。
Deep Research Agent技术 --通义“狐獴家族”(一)
综合论文方法论、真实场景暴露的短板,以及内部知识库与外部 Web 检索双轨并行的实际需求,我们完成了一套私有化部署的深度检索系统:
Android手机开发课程标准 中文WORD版
本课程在设计上本着懂方法,重应用的总体思路,突出体现职业教育的技能型、应用性特色,着重培养学生的实践应用技能,力求达到理论方法够用,技术技能过硬的目的。 通过本课程的学习,使学生具备Android平台应用开发相关知识、良好的编程习惯和手机应用软件开发的能力,能胜任基于Android平台的手机软件研发等工作任务。感兴趣的朋友可以过来看看
0
查看详情
深度检索通常面向具体问题,输出以精炼回答为主。但随着技术成熟与用户期待升级,需求已悄然跃迁至更高层级:“请 AI 独立开展系统性研究,并交付一份结构清晰、逻辑严密、图文并茂的深度研究报告。”
Deep Research Agent技术 --通义“狐獴家族”(二)
前两篇文章中,我已系统阐述了从 RAG → 深度检索 → 深度研究报告的技术跃迁路径,本文不再重复技术细节,基础流程可参考图一框架中的对应模块:
descript本文重点聚焦于:通用 DeepResearch 方案与企业级落地之间的关键差异,以及我们为何选择自研整套 DeepResearch Agent。
目前,我们自研的 DeepResearch Agent 已在 DeepResearch_Bench 官方评测榜单中,采用标准测评方式验证,性能稳居前三,超越第三名。
descript
descript核心突破体现在以下五方面:
(1)多智能体协同架构
依据图一模块划分,完整的 DeepResearch 流程需多个专业化 Agent 模块与工具链协同运作,从而保障最终输出的专业性、系统性与可控性。
(2)自研 Query 扩展模型,拓展研究广度与维度
针对真实业务中普遍存在的指代模糊、问题漂移、语义窄化等 Query 理解难题,我们基于高质量多维标注数据集,对 7B 规模模型开展 SFT + RLHF 训练。实测效果已与开源 32B 模型持平,实现小模型、高性价比的工程落地目标。
(3)自研 Deep Search 搜索引擎
深度融合自研 Web 检索工具与多跳推理框架,大幅提升复杂主题下的信息挖掘与跨源整合能力,使模型更擅长链式推理与证据闭环构建。
(4)全链路性能优化体系
为保障在企业环境中真正可用、可扩、可运维,我们开展了系统级性能攻坚:
(5)多模态能力原生集成
当前主流开源 DeepResearch 方案普遍缺乏多模态支持,而我们在 RAG 项目中已构建完整图文理解与检索能力,得以平滑迁移至 DeepResearch 全流程。
此外,在真实企业场景中,我们观察到各业务线对 DeepResearch 的诉求差异极大,例如:
属报告模板; 这些需求,远超现有开源框架的默认能力边界。因此,我们在自研 DeepResearch Agent 架构基础上,投入大量工程化建设,将其打磨为真正可交付、可配置、可运维的企业级产品方案。
descript在工程能力上,我们还通过 AI Coding 模块实现了“一键生成 HTML 可视化报告”的能力,让研究成果可快速发布与共享。
descript同时上线在线画布功能,支持业务人员与 AI 直接交互、实时调整报告结构与内容。
descript5. 多模态多模态方向,我们的技术探索聚焦三大核心能力:多模态理解、多模态生成、多模态推理加速。
本文主线围绕 RAG → DeepResearch Agent 全流程展开,当前企业在该链条中最常用、最刚需的能力,仍是多模态理解。
其中,版面分析是 RAG 流程中至关重要却常被低估的一环。文档解析的质量,直接决定后续文本切片合理性、检索准确性与最终回复质量。我们在此环节历经多轮技术迭代:
实践表明,没有“银弹”方案。不同业务的数据分布特征、延迟容忍度、算力预算均不同,需按场景择优选型。
完成版面分析后,下一步是对文档中图像内容进行深度理解与处理。
我们在 RAG 中构建的图文检索与生成链路包括:
最终交付的是兼具信息密度与视觉表达力的多模态回复。
6. Agent如果说 RAG 解决的是“让模型知道该看什么”,赋予其记忆;
DeepSearch 解决的是“让模型知道该怎么看”,赋予其思考;
DeepResearch 解决的是“让模型能把看过的内容系统性组织起来”,赋予其研究能力;
那么 Agent 要解决的,就是“让模型自主判断下一步该做什么”,赋予其执行力。
当我们沿着 RAG → 联网检索 → 深度搜索 → 深度研究这条路径持续演进,技术走向已愈发清晰:从“被动回答问题”,正加速迈向“主动完成任务”。
即便不刻意对标 Agent 框架,产品为满足真实业务需求,也必然自发演化出 Agent 特性——它需要理解用户意图、感知环境变化、调用合适工具、执行推理研究,并交付端到端解决方案。
当然,在企业实践中,算法只是拼图一角。哪怕仅从纯技术视角出发,AI 从来都不是单一模型或框架,而是一整套涵盖数据、算法、工程、运维的复合型技术体系。
在 RAG → 深度检索 → DeepResearch → Agent 的建设过程中,除算法研发外,我们同步构建了完整的工程底座:包括弹性算力平台、标准化中间件、工具链生态、全链路可观测性、并发调度引擎、缓存机制及运营数据大盘等。
回看去年的技术文章,更多聚焦于理论探讨与方法论沉淀;而今年,团队已在深度报告 Agent 方向实现规模化场景落地,完整走通了从 RAG 到 Agent 的技术闭环:
总体而言,企业大模型落地绝非仅靠几个先进模型即可达成,而是一项横跨业务理解、知识管理、数据治理、算法研发、工程实现与性能优化的系统工程。RAG 是不可或缺的起点,但唯有叠加深度检索、深度研究与 Agent 化能力,才能真正释放 AI 的决策智能与生产力价值。
朗新AI研究院已在多个关键技术方向形成深厚积累,成功孵化出一系列面向集团内部业务场景的智能体应用。
其中,深度研究报告系统、“产品博士”与“售前专家”等核心智能体,均深度集成了本文所述的 DeepResearch 技术能力。

以上就是RAG到DeepResearch技术路线实践的详细内容,更多请关注其它相关文章!
# html
# 工具
# ai
# 搜索引擎
# 数据清洗
# 大模型
# 金球奖
# seo服务哪家便宜
# 课程标准
# 东晓高端网站建设
# 阳明街道外贸网站建设
# 太原seo接单
# 抖音营销推广哪家好
# 制作一份营销推广方案
# 邹平外贸网站推广方法
# 宁波小型网站建设公司
# 广州seo电子如何
# 南山区网站推广价格实惠
# 闭环
# 重构
# 研究报告
# 文档
# 多个
# 链路
# 的是
# 多模
# deep search
# descript
# deepseek
# 热点
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
OpenAI限制网络爬虫访问以保护数据免被用于AI模型训练
Gartner发布中国企业人工智能趋势浪潮3.0
选对AI智能写作软件,让创作游刃有余!
英特尔张宇:边缘计算在整个AI生态系统中扮演重要角色
借力AI!PCB全球巨头,有爆发潜质吗?
AI工具助力公司实施每周4.5天工作制,带来巨大效益
图灵奖得主Hinton:我已经老了,如何控制比人类更聪明的AI交给你们了
GPT-4不能在麻省理工学院获得计算机科学学位
谷歌AudioPaLM实现「文本+音频」双模态解决,说听两用大模型
谷歌新安卓机器人logo曝光:头更大了
上海发布“元宇宙关键技术攻关行动方案”,加快 AIGC 等突破
喜马拉雅在国际会议挑战赛中突破语音重叠难题斩获第一 加速AI创新
全场景智能车:智能无处不在|芯驰亮相世界人工智能大会
中国联通发布图文AI大模型,可实现以文生图、视频剪辑
无人机巡检方案是什么,该如何选择适合的巡检方案
微软更新服务协议,以防止通过AI服务进行逆向工程和数据抓取
70年前他本想逃避考试,却影响了整个互联网
图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响
令人震惊的特斯拉机器人
探索人工智能在居家养老方面的应用
AI绘画,还需要懂数学?
AI技术改变*,新骗局来袭,*成功率接近100%
马克龙密会AI专家,法国加入全球人工智能竞赛
MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
赋能选题探索:AI助手在经济学专业中的应用指南
用AI升级会议体验!思必驰多款会议产品亮相全球智博会!
能走、能飞、能游泳,科学家打造全能 M4 机器人
郭帆谈ChatGPT:电影行业需要创新,否则人工智能将让电影变得平庸
创作音乐/音频的Meta开源AI工具AudioCraft,让用户通过文本提示实现
洞穴探险神器?可自主导航的单旋翼自旋无人机,效率更高!
“直击”AI新世界,智能机器人再次“火出圈”了
人工智能助力精准学习,猿辅导小猿学练机满足学生个性化学习需求
行业首发「超级智绘」AI故事集,TCL实业推进AI技术应用
兆讯传媒率先全面拥抱AI 数智广告内容焕发新生机
Meta发布语音AI模型 Voicebox 助虚拟助手与NPC对话
AI生成会议纪要 百度如流升级推出超级助手、智能编码等功能
好莱坞面临全面停摆 好莱坞大罢工抵制“AI入侵”
石头扫拖机器人 G20 618 福利来袭:4999 元,超值配件领到手软
揭示经济学论文写作中提高效率与质量的AI助手应用策略
企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的
学而思推出AI第一课:基于自研大模型的AIGC课程
猿辅导推出Motiff,整合三大AI功能,助力UI设计生产力革新
OpenAI首席执行官表态支持欧盟AI监管
iPhone两秒出图,目前已知的最快移动端Stable Diffusion模型来了
禁止艺术家使用 AI 创作《龙与地下城》游戏插图的决定已在 D&D Beyond 生效
深度学习模型综述:用于3D MRI和CT扫描的应用
「模仿学习」只会套话?解释微调+130亿参数Orca:推理能力打平ChatGPT
智能客服进入AI 2.0时代 容联云发布语言大模型“赤兔”
马斯克预测:特斯拉全自动驾驶将在今年实现 对AI深度变化感到担忧
OpenAI CEO 阿尔特曼到访日本,对全球 AI 协调合作表示乐观