发布时间:2024-03-06
点击次数: 在本篇文章中我们将介绍如何开发一个深度学习模型来检测人工智能生成的图像。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
许多用于检测人工智能生成图像的深度学习方法都根据图像生成的方式或者图像的特性/语义来确定,通常这些模型只能识别人工智能生成的特定对象,比如人、脸、汽车等。
然而,这项名为“Rich and Poor Texture Contrast: A Simple yet Effective Approach for AI-generated Image Detection”的研究提出的方法克服了这些挑战,具有更广泛的适用性。我们将深入探讨这篇研究论文,阐明它是如何有效解决了其他检测人工智能生成图像方法所面临的问题。
当我们使用一个模型(比如ResNet-50)来识别人工智能生成的图像时,模型会根据图像的语义进行学习。如果我们训练一个模型来识别人工智能生成的汽车图像,使用真实图像和人工智能生成的不同汽车图像进行训练,那么该模型将只能从这些数据中获取有关汽车的信息,而对于其他物体则无法进行准确识别。
虽然可以对各种对象的数据进行训练,但这种方式耗时较长,而且仅能在未知数据上达到大约72%的准确率。尽管可以通过增加训练次数和数据量来提高准确性,但我们无法无限地获取训练数据。
也就是说目前检测模型的泛化性有很大的问题,为了解决这个问题,论文提出了以下的方法
这篇论文介绍了一种独特的方法,用于防止模型在训练过程中从图像的形状中学习到人工智能生成的特征。作者提出了一种名为Smash&Reconstruction的方法来实现这一目标。
在这种方法中,图像被分成预定大小的小块,然后对它们进行重新排列,以生成新的图像。这只是一个简单的概述,因为在形成生成模型的最终输入图像之前,还需要进行额外的步骤。

将图像分割成小块后,我们将小块分成两组,一组是纹理丰富的小块,另一组是纹理较差的小块。
图像中细节丰富的区域,如物体或两个对比色区域之间的边界,就成为一个丰富的纹理块。与主要是背景的纹理区域(如天空或静止的水)相比,丰富的纹理区域在像素上有很大的变化。
首先将图像分成预先确定大小的小块,如上图所示。然后找到这些图像块的像素梯度(即找出水平方向、对角线方向和反对角线方向上的像素值之差并将它们相加),并将它们分离成丰富纹理块和纹理较差块。
与纹理较差的块相比,纹理丰富的块具有更高的像素梯度值,计算图像梯度值得公式如下:

在像素对比度的基础上对图像进行分离,得到两幅合成图像。这一过程是本文称之为“Smash&Reconstruction”的完整过程。

这样就让模型学习到得是纹理的细节,而不是物体的内容表征
大多数基于指纹的方法受到图像生成技术的限制,这些模型/算法只能检测由特定方法/类似方法(如扩散、GAN或其他基于CNN的图像生成方法)生成的图像。
为了精确地解决这个问题,论文已经将这些图像块划分为丰富或贫乏的纹理。然后作者又提出了一种识别人工智能生成图像指纹的新方法,这也就是论文的标题。他们提出在应用30个高通滤波器后,找到图像中丰富和贫乏纹理斑块之间的对比度。
Machine Translation
聚合多个来源的AI翻译
49
查看详情
为了更好理解,我们将图像并排比较,真实图像和人工智能生成的图像。

这两张图像使用肉眼观看也是很难查看他们的去别的对吧
论文首先使用Smash&Reconstruction 过程:


在每个图像上应用30个高通滤波器后,它们之间的对比度:


从这些结果中我们可以看到,人工智能生成的图像与真实图像的对比度相比,纹理斑块丰富和贫乏的对比度要高得多。
这样我们用肉眼就可以看到区别了,所以可以将对比度的结果放入可训练模型,并将结果数据输入分类器,这样就是我们这篇论文的模型架构:

分类器的结构如下:

论文中提到了30个高通滤波器,这些滤波器最初是为隐写分析而引入的。
注:图片隐写的方式有很多种。广义上,只要通过某种方式将信息隐藏到图片中而难以通过普通方式发现,就可以称为图片隐写,对于隐写分析有很多相关的研究,有兴趣的可以查阅相关资料。
这里的过滤器是使用卷积方法应用于图像的矩阵值,所使用的滤波器是高通滤波器,它只允许图像的高频特征通过它。高频特征通常包括边缘、精细细节和强度或颜色的快速变化。

除(f)和(g)外,所有滤波器在重新应用于图像之前都以一定角度旋转,因此总共形成30个滤波器。这些矩阵的旋转是用仿射变换完成的,而仿射变换是用SciPy完成的。
论文的结果已经达到了92%的验证精度,并且据说如果训练的更多还会有更好的结果,这是一个非常有意思的研究,我还找到了训练的代码,有兴趣的可以深入研究:
论文:https://arxiv.org/abs/2311.12397
代码:https://github.com/hridayK/Detection-of-AI-generated-images
以上就是使用纹理对比度检测检测AI生成的图像的详细内容,更多请关注其它相关文章!
# 深度学习
# 排列
# 小块
# 提出了
# 并将
# 高通
# 这篇
# 本田
# 人工智能
# seo外包源头
# 五一狂欢营销推广
# 营销网站建设经验
# 松江区营销推广分析会议
# 宿城网站推广
# PLC论文网站建设
# 德育教案网站建设需要
# 深圳优秀网站建设公司
# 东莞财税推广员招聘网站
# 乐有家的网络营销推广
# 有兴趣
# 腾讯
# 太多
# 丰田
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
Midjourney创始人:AI应该成为人类思想的延伸
腾讯自主研发机器狗 Max 升级,可“奔跑跳跃”完成避障动作
苹果2万5的AR遭遇砍单95%:不及预期
联想浏览器引入小乐 AI 助手,成功接入百度文心一言大模型,经过实测证实
马斯克反讽人工智能AI炒作:“机器学习”本质就是统计
万魔推出AI主攻的运动耳机,开启十年研发新纪元
GPT-4最全攻略来袭!OpenAI官方发布,六个月攒下来的使用经验都在里面了
一图速览 | 十大脑机接口关键技术发布
构建数字文旅新高地!洛阳涧西区开启元宇宙时代
「电子果蝇」惊动马斯克!背后是13万神经元全脑图谱,可在电脑上运行
物联网“僵尸网络DDos攻击”增长惊人,威胁全球电信网络
“长沙造”无人机,领先的不止植保
自然语言生成在智能家居设备中的应用
人工智能赋能无人驾驶:商业化进程再提速
人工智能赋能广西自然资源领域监测监管
美图设计室2.0使用教程
引领AI变革,九章云极DataCanvas公司重磅发布AIFS+DataPilot
消息称 Meta Quest 将推 VR 游戏订阅:每月 7.99 美元,任选两款
VMS的应用:提升多品牌设备管理效能
大疆 Air 3 无人机售价和实物照片曝光
元宇宙迈入2.0时代,它和生成式人工智能有何关联吗?
联想首发AI PC于今年秋季,英特尔CEO确认AI PC时代来临
苹果在韩举办首届中小企业智能制造论坛,加速推动工业4.0发展
机构研选 | 虚拟电厂是电力物联网升级版 智能电网望迎来高速发展
OpenAI已向中国申请注册“GPT-5”商标,此前已在美国提交申请
生成式AI与云结合,机遇与挑战并存
美图秀秀发布7款AI产品:支持用户创作、商业创作
数据显示:人工智能相关专业热度上升最快 考古、美术、生物医学工程等小众专业火了
码刻 | 48小时Hackathon,源码见证新生代AI创新的发生
聚焦WAIC|AI技术支撑大模型探索未来
腾讯企点客服接待与营销分析能力升级!企业操作更高效、人机交互更智能
谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程
通用医疗人工智能如何革新医疗行业?
OpenAI 引入个性化指令功能,消除对话中的重复偏好与信息
这款在《自然通讯》发表的机器人,为变形金刚来到现实创造可能性
无需标注数据,「3D理解」进入多模态预训练时代!ULIP系列全面开源,刷新SOTA
爱设计PPT发布第二代AI一键生成PPT产品:智能、个性化、自动化
大脚攀爬者车主福利!无人机、运动相机大奖等你来挑战
不止“文心一言”,消息称百度将推出全新 AI 对话软件“万话”
携程发布旅游行业垂直大模型 梁建章:AI策略是做可靠的内容 放心的推荐
喜马拉雅在国际会议挑战赛中突破语音重叠难题斩获第一 加速AI创新
苹果公司迅速拓展AR/VR团队,Vision Pro发布后7月份增设近100份工作机会
技术如何使人变得懒惰?
云米Smart 2E AI立式空调开启预售:新三级能效,到手价3899元
DragGAN开源三天Star量23k,这又来一个DragDiffusion
英伟达CEO宣称生成式AI已迎来“划时代时刻”
原小米 9 号员工李明打造全球首款 AI 安卓桌面机器人
世界周刊丨AI“棱镜”?
构建AI绘画网站的方法:使用API接口和调用步骤
深度学习模型综述:用于3D MRI和CT扫描的应用