400 128 6709

行业新闻

数百项 AI 安全测试存在严重缺陷

发布时间:2025-11-04点击次数:

数百项 ai 安全测试存在严重缺陷

由英国政府AI安全研究所联合多所顶尖高校的计算机科学家开展的一项研究揭示,当前广泛用于衡量新一代人工智能(AI)模型安全性与效能的评估体系存在普遍性漏洞。研究人员对超过440个现有基准测试进行了系统分析,结果发现几乎每一项测试都在设计或执行层面存在某种形式的缺陷,可能严重影响其评估结果的可信度。

牛津互联网研究所的研究员安德鲁・比恩(Andrew Bean)作为该研究的主要负责人指出,这些基准测试本应是验证新型AI系统是否安全、可控并符合人类价值观的关键手段。然而,由于行业缺乏统一的技术标准和严谨的验证机制,目前很难判断AI模型的实际表现是在持续提升,还是仅仅在特定测试条件下“看起来”更优。

在美英两国尚未建立全面AI监管框架的现状下,这类基准测试实际上承担着类似“自我监管”的角色,成为科技公司在发布新AI产品前的重要参考。但近年来已有多起因AI输出有害内容而被迫下架产品的案例。例如,谷歌此前不得不撤回其开源AI模型Gemma,原因是该模型生成了关于一名美国参议员的虚假负面信息,引发公众强烈质疑。

Mistral AI Mistral AI

Mistral AI被称为“欧洲版的OpenAI”,也是目前欧洲最强的 LLM 大模型平台

Mistral AI 182 查看详情 Mistral AI

谷歌随后澄清称,Gemma原本面向开发者和研究人员,并非为大众用户设计,在发现被不当使用后迅速采取了回收措施。研究还指出,大多数基准测试缺乏对结果不确定性的量化分析,仅有16%的测试采用了统计显著性检验等科学方法。同时,在评估如“无害性”“公平性”等关键属性时,相关标准定义模糊、主观性强,导致不同测试之间难以横向比较。

为此,研究团队呼吁全球AI社区共同推动建立开放、透明且标准化的评估框架,制定通用的最佳实践指南,以增强AI安全测试的可靠性与可重复性,从而真正保障技术发展的稳健与可信。

以上就是数百项 AI 安全测试存在严重缺陷的详细内容,更多请关注其它相关文章!


# 互联网  # 网站建设公司 临沂  # 黄冈网站app推广下载官网  # 营销推广简历优缺点  # 新浦营销推广费用  # SEO的含义和象征  # 原神推广视频官方网站在哪  # 优化汽车网站排名  # 唐山网站优化机构  # 蓬莱智能营销推广定制  # 搜索运营和seo  # 是在  # 计算机  # 牛津  # 年中  # 之父  # 英国政府  # 百项  # 欧洲  # 微软  # 押注  # ai  # 谷歌  # 人工智能 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 映宇宙数字人“映映”亮相ChinaJoy,展示AI黑科技实现用户互动  华为联合合作伙伴 共同发布昇腾AI大模型训推一体化解决方案  智能电网技术:提高能源效率和可靠性  谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程  以计算机视觉技术为基础的库存管理如何改革零售行业  扎克·施奈德新片《月球叛军》曝剧照 机器人首度现身  大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务  应对算力挑战,亚马逊云科技发力AI基础设施建设  “智能体动作生成技术”现身WAIC:游戏AI技术为机器人科创注入新动力  Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽  世界人工智能大会|“AI领航,共筑未来”高端保险论坛成功举办  Intel酷睿Ultra发布会官宣!迈向全新的AI时代  国内首家,360智脑通过中国信通院可信AIGC大语言模型功能评估  微幼科技晨检机器人:幼儿园健康保障的新伙伴  轻量级的深度学习框架Tinygrad  2025VR&AR显示技术峰会展示歌尔光学最新一代光学模组  人工智能如何帮助制造业?  搭载星火认知大模型 讯飞听见智慧屏开启AI办公新体验  不止“文心一言”,消息称百度将推出全新 AI 对话软件“万话”  借力AI!PCB全球巨头,有爆发潜质吗?  元宇宙技术带你穿梭“大运河”,江苏书展上的数字阅读馆吸睛小读者  “直击”AI新世界,智能机器人再次“火出圈”了  AI行业盛会大咖云集!Sam Altam、“AI教父”......一文看懂最新观点  洞穴探险神器?可自主导航的单旋翼自旋无人机,效率更高!  猿编程参加人工智能高峰论坛,推动人工智能教育解决方案在千所学校推行  猿辅导推出Motiff,整合三大AI功能,助力UI设计生产力革新  ChatGPT只讲这25个笑话!实验上千次有90%重复,网友:幽默是人类最后的尊严  郭帆:AI发展日新月异,或是弯道超车好莱坞的最好机会  数字彩排、虚拟建厂!这家顶级洗衣机工厂敲开“工业元宇宙”之门  视觉中国推出AI灵感绘图功能  海南省公安机关警用无人机培训班结业并举行警航比武演练  两架海燕号无人机交付中国气象局 助力建设国家级机动气象观测业务  第二届光合组织AI解决方案大赛赛果揭晓  特斯拉 Optimus 人形机器人入驻北美门店,帮助提升汽车销量  拓普龙7188ML:轻便壁挂式工控机箱,为人工智能应用场景提供有力保障  2025世界人工智能大会(上海)开幕式纪要  生成式人工智能来了,如何保护未成年人? | 社会科学报  “聚智启新,‘蓉’力同行” 成都市人工智能产业融通对接会成功举办  微软和谷歌面临的人工智能困境:需要投入大量资金才能获得盈利  宇宙探索下一阶段,机器代替人类,AI会在太空探索中取代人类吗?  周星驰支持的人工智能与 Web3 初创公司 Moonbox 完成 100 万美元融资  “思享荟”沙龙热议AIGC与元宇宙 复旦大学赵星畅谈深度数字化  无人机在电力巡检中的应用:全面解析高效巡检流程  马克龙密会AI专家,法国加入全球人工智能竞赛  商业智能决策技术助力降本增效,世界人工智能大会举办商业AI高峰论坛  零AI含量!纯随机数学无限生成逼真3D世界火了,普林斯顿华人一作  日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病  Meta发布"类人"AI图像创建模型,能解决多出手指等Bug  360°/180°双模式,佳能公布可折叠小体积的VR全景相机  Yann LeCun团队新研究成果:对自监督学习逆向工程,原来聚类是这样实现的 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司