400 128 6709

行业新闻

YoloCS:有效降低特征图空间复杂度

发布时间:2024-06-05点击次数:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

YoloCS:有效降低特征图空间复杂度

论文地址:yolocs: object detection based on dense channel compression for feature spatial solidification (arxiv.org)

01 总  述

在今天分享中,研究者检查了在特征纯化和梯度反向传播过程中信道特征和卷积核之间的关联,重点是网络内的前向和反向传播。因此,研究者提出了一种称为密集通道压缩的特征空间固化方法。根据该方法的核心概念,引入了两个用于骨干网络和头部网络的创新模块:用于特征空间固化的密集通道压缩(DCFS)和非对称多级压缩解耦头部(ADH)。当集成到YOLOv5模型中时,这两个模块表现出非凡的性能,从而产生了一个被称为YOLOCS的改进模型。

YoloCS:有效降低特征图空间复杂度  YoloCS:有效降低特征图空间复杂度

在MSCOCO数据集上评估,大、中、小YOLOCS模型的AP分别为50.1%、47.6%和42.5%。在保持与YOLOv5模型的推理速度相似的情况下,大、中、小YOLOCS模型分别达到了1.1%、2.3%和5.2%的优势超过YOLOv5的AP。

02 背  景

近年来,目标检测技术在计算机视觉领域受到了广泛关注。其中,基于单发多框算法的目标检测技术(Single Shot Multi Box Detector,简称SSD)和基于卷积神经网络的目标检测技术(Convolutional Neural Networks,简称CNN)是两种最常用的目标检测技术。然而,由于单发多框算法的精度较低,而基于卷积神经网络的目标检测技术的计算复杂度较高,因此,寻找一种高效且精度较高的目标检测技术成为了当前研究的热点之一。

YoloCS:有效降低特征图空间复杂度

Dense Channel Compression (DCC) 是一种新型的卷积神经网络压缩技术,它通过对卷积神经网络中的特征图进行空间固化,从而实现对网络参数的压缩和加速。然而,DCC技术在目标检测领域的应用尚未得到充分的研究。 Dense Channel Compression (DCC) 技术旨在通过减少网络参数的数量来提高计算效率。具体而言,DCC通过对卷积层的输出特征图进行通道压缩,从而减少卷积层的参数数量。这种压缩技术可以通过删除冗余和不必要的通道,或者使用低秩分解等方法来实现。 尽管DCC技术在图像分类任务上

YoloCS:有效降低特征图空间复杂度

因此,提出了一种基于Dense Channel Compression的目标检测技术,命名为YOLOCS(YOLO with Dense Channel Compression)。YOLOCS技术将DCC技术与YOLO(You Only Look Once)算法相结合,实现了对目标检测的高效且精度较高的处理。具体来说,YOLOCS技术通过DCC技术对特征图进行空间固化,从而实现了对目标标位置的精确定位;同时,YOLOCS技术利用YOLO算法的单发多框算法特点,实现了对目标标别分类的快速计算。

03 新框架

  • Dense Channel Compression for Feature Spatial Solidification Structure (DCFS)

YoloCS:有效降低特征图空间复杂度

在提出的方法中(上图(c))中,研究者不仅解决了网络宽度和深度之间的平衡问题,还通过3×3卷积压缩了来自不同深度层的特征,在输出和融合特征之前将通道数量减少了一半。这种方法使研究者能够在更大程度上细化来自不同层的特征输出,从而在融合阶段增强特征的多样性和有效性。

此外,来自每一层的压缩特征都带有更大的卷积核权重(3×3),从而有效地扩展了输出特征的感受野。将这种方法称为特征空间固化的密集通道压缩。用于特征空间固化的密集通道压缩背后的基本原理依赖于利用较大的卷积核来促进通道压缩。该技术具有两个关键优点:首先,它扩展了前向传播过程中特征感知的感受域,从而确保了区域相关的特征细节被纳入,以最大限度地减少整个压缩阶段的特征损失。其次,误差反向传播过程中误差细节的增强允许更准确的权重调整。

为了进一步阐明这两个优点,使用具有两种不同核类型(1×1和3×3)的卷积来压缩两个通道,如下图:

YoloCS:有效降低特征图空间复杂度

DCFS的网络结构如下图所示。采用三层瓶颈结构,在网络前向传播的过程中逐渐压缩信道。半通道3×3卷积应用于所有分支,然后是批处理归一化(BN)和激活函数层。随后,使用1×1卷积层来压缩输出特征通道,以匹配输入特征通道。

YoloCS:有效降低特征图空间复杂度

  • Asymmetric Multi-level Channel Compression Decoupled Head (ADH)

为了解决YOLOX模型中的解耦头问题,研究者进行了一系列的研究和实验。研究结果揭示了解耦头部结构的利用与相关损失函数之间的逻辑相关性。具体而言,对于不同的任务,应根据损失计算的复杂性调整解耦头的结构。此外,当将解耦的头部结构应用于各种任务时,由于最终输出维度的差异,将前一层的特征通道(如下图)直接压缩为任务通道可能会导致显著的特征损失。这反过来又会对模型的整体性能产生不利影响。

YoloCS:有效降低特征图空间复杂度

此外,当考虑提出的用于特征空间固化的密集通道压缩方法时,直接减少最终层中的通道数量以匹配输出通道可能会导致前向传播过程中的特征丢失,从而降低网络性能。同时,在反向传播的背景下,这种结构可能会导致次优误差反向传播,阻碍梯度稳定性的实现。为了应对这些挑战,引入了一种新的解耦头,称为非对称多级通道压缩解耦头(如下图(b))。

YoloCS:有效降低特征图空间复杂度

具体而言,研究者深化了专用于目标评分任务的网络路径,并使用3个卷积来扩展该任务的感受野和参数数量。同时,沿着通道维度压缩每个卷积层的特征。该方法不仅有效地减轻了与目标评分任务相关的训练难度,提高了模型性能,而且大大减少了解耦头部模块的参数和GFLOP,从而显著提高了推理速度。此外,使用1卷积层来分离分类和边界框任务。这是因为对于匹配的正样本,与两个任务相关联的损失相对较小,因此避免了过度扩展。这种方法大大降低了解耦头中的参数和GFLOP,最终提高了推理速度。

04 实验可视化

Ablation Experiment on MS-COCO val2017

YoloCS:有效降低特征图空间复杂度

Comparison of YOLOCS, YOLOX and YOLOv5- r6.1[7] in terms of AP on MS-COCO 2017 test-dev

YoloCS:有效降低特征图空间复杂度

YoloCS:有效降低特征图空间复杂度


灵感PPT 灵感PPT

AI灵感PPT - 免费一键PPT生成工具

灵感PPT 308 查看详情 灵感PPT

以上就是YoloCS:有效降低特征图空间复杂度的详细内容,更多请关注其它相关文章!


# 卷积  # 固始推广营销招聘网站  # nike运动鞋的视频营销推广方案  # 丰都seo优化  # 提出了  # 两种  # 本田  # 福特  # 前向  # 如下图  # 较高  # 过程中  # 检测技术  # x detector  # 压缩技术  # 特征  # 锦州关键词排名怎么选  # 同心企业网站优化案例  # 草棚seo视频教程  # 自我评价简历seo  # 优化课题平台有哪些网站  # 安布思沛 seo  # 景德镇seo快照 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 国内首款大尺寸仿鸵双足机器人“大圣”亮相,穿戴红色战袍  比尔盖茨:AI确实存在风险,但可控  陈根:AI工具为游戏软件实时3D内容助力  掌阅科技对话式AI应用“阅爱聊”开启内测  AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲  借助ChatGPT快速上手ElasticSearch dsl  小艺主导智慧交互升级,借助AI大模型增强能力  650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了  【搞事】时隔4年 谷歌更新安卓logo 机器人头更饱满了  "探索Meta发布的Quest MR/VR视频录制与拍摄指南"  网易加速行业AI大模型应用,将覆盖100多个应用场景  三个全球首创,青岛西海岸新区“海元宇宙”亮相世界人工智能大会  人工智能赋能无人驾驶:商业化进程再提速  麦肯锡:到 2045 年左右,将有 50% 工作被 AI 接管  食品分销跨国企业Sysco CIDO:我们的增长秘诀是以IT为中心  彭博社:苹果Vision Pro曾测试VR手柄追踪方案  郭帆谈ChatGPT:电影行业需要创新,否则人工智能将让电影变得平庸  多家欧洲企业签署公开信,批评欧盟 AI 法案草案限制产业发展  优化系统韧性:故障恢复与监控在RabbitMQ中的应用  微软 Copilot 团队主管呼吁用户与 AI 交流时应使用恰当的礼貌用语  2025世界人工智能大会成功召开  加强高质量数据供应能力,促进通用人工智能大模型领域的创新  “一般智力”与工艺学批判是认识AI的重要入口 | 社会科学报  揭秘AI数字人语录:抖音AI小和尚、老者语录能赚钱吗?  盘古大模型3.0正式发布 AI开发正走向新“工业化开发模式”  GPT-4成功战胜AI-Guardian审核系统:谷歌研究团队的人工智能抵抗人工智能  MIT开发“PhotoGuard”技术保护图像免遭恶意AI编辑  马斯克WAIC2025演讲全文:AI将对人类文明产生深远影响  机智云AI离线语音识别模组,让家电变得更加智能便捷  2025 世界人工智能大会闭幕,32 个重大产业签约总额达 288 亿元  一文看懂基础模型的定义和工作原理  万兴播爆桌面端上线,支持AI数字人搜索、视频编辑等功能  烟台大学学生首次在全国大学生无人机航拍竞赛中获奖  英国前首相:AI可能被用来制造“生物恐怖武器”  苹果机器学习关键人物 Ali Farhadi 离职,回归 AI2 担任 CEO  英伟达推出 L40S GPU,AI 推理性能超过 A100 约 1.2 倍  英伟达CEO宣称生成式AI已迎来“划时代时刻”  金山办公宣布与英伟达团队合作,加速WPS AI服务  机器人 展才能  AI时代,企业需要什么样的员工?  小米首次曝光 64 亿参数的 MiLM-6B AI 大模型,或将应用于小爱同学  一次购买全年省心,入手科沃斯这几台机器人,省下时间就是金钱  全新升级的广州麦当劳:面积最大餐厅正式引入智慧机器人  WHEE上线时间介绍  图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响  干货满满,2025昆山元宇宙国际装备展等你来打卡!  V社谈AI制作游戏被ban:为确保开发者有素材所有权  Nature封面:量子计算机离实际应用还有两年  AI 助手 Copilot 上线,微软 Win11 Dev 预览版 Build 23493 发布  XREAL Beam 投屏盒子正式发布:支持“可悬停 AR 空间屏” 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司