发布时间:2025-11-04
点击次数: 
由英国政府AI安全研究所联合多所顶尖高校的计算机科学家开展的一项研究揭示,当前广泛用于衡量新一代人工智能(AI)模型安全性与效能的评估体系存在普遍性漏洞。研究人员对超过440个现有基准测试进行了系统分析,结果发现几乎每一项测试都在设计或执行层面存在某种形式的缺陷,可能严重影响其评估结果的可信度。
牛津互联网研究所的研究员安德鲁・比恩(Andrew Bean)作为该研究的主要负责人指出,这些基准测试本应是验证新型AI系统是否安全、可控并符合人类价值观的关键手段。然而,由于行业缺乏统一的技术标准和严谨的验证机制,目前很难判断AI模型的实际表现是在持续提升,还是仅仅在特定测试条件下“看起来”更优。
在美英两国尚未建立全面AI监管框架的现状下,这类基准测试实际上承担着类似“自我监管”的角色,成为科技公司在发布新AI产品前的重要参考。但近年来已有多起因AI输出有害内容而被迫下架产品的案例。例如,谷歌此前不得
不撤回其开源AI模型Gemma,原因是该模型生成了关于一名美国参议员的虚假负面信息,引发公众强烈质疑。
Mistral AI
Mistral AI被称为“欧洲版的OpenAI”,也是目前欧洲最强的 LLM 大模型平台
182
查看详情
谷歌随后澄清称,Gemma原本面向开发者和研究人员,并非为大众用户设计,在发现被不当使用后迅速采取了回收措施。研究还指出,大多数基准测试缺乏对结果不确定性的量化分析,仅有16%的测试采用了统计显著性检验等科学方法。同时,在评估如“无害性”“公平性”等关键属性时,相关标准定义模糊、主观性强,导致不同测试之间难以横向比较。
为此,研究团队呼吁全球AI社区共同推动建立开放、透明且标准化的评估框架,制定通用的最佳实践指南,以增强AI安全测试的可靠性与可重复性,从而真正保障技术发展的稳健与可信。
以上就是数百项 AI 安全测试存在严重缺陷的详细内容,更多请关注其它相关文章!
# 互联网
# 网站建设公司 临沂
# 黄冈网站app推广下载官网
# 营销推广简历优缺点
# 新浦营销推广费用
# SEO的含义和象征
# 原神推广视频官方网站在哪
# 优化汽车网站排名
# 唐山网站优化机构
# 蓬莱智能营销推广定制
# 搜索运营和seo
# 是在
# 计算机
# 牛津
# 年中
# 之父
# 英国政府
# 百项
# 欧洲
# 微软
# 押注
# ai
# 谷歌
# 人工智能
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
映宇宙数字人“映映”亮相ChinaJoy,展示AI黑科技实现用户互动
华为联合合作伙伴 共同发布昇腾AI大模型训推一体化解决方案
智能电网技术:提高能源效率和可靠性
谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程
以计算机视觉技术为基础的库存管理如何改革零售行业
扎克·施奈德新片《月球叛军》曝剧照 机器人首度现身
大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务
应对算力挑战,亚马逊云科技发力AI基础设施建设
“智能体动作生成技术”现身WAIC:游戏AI技术为机器人科创注入新动力
Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽
世界人工智能大会|“AI领航,共筑未来”高端保险论坛成功举办
Intel酷睿Ultra发布会官宣!迈向全新的AI时代
国内首家,360智脑通过中国信通院可信AIGC大语言模型功能评估
微幼科技晨检机器人:幼儿园健康保障的新伙伴
轻量级的深度学习框架Tinygrad
2025VR&AR显示技术峰会展示歌尔光学最新一代光学模组
人工智能如何帮助制造业?
搭载星火认知大模型 讯飞听见智慧屏开启AI办公新体验
不止“文心一言”,消息称百度将推出全新 AI 对话软件“万话”
借力AI!PCB全球巨头,有爆发潜质吗?
元宇宙技术带你穿梭“大运河”,江苏书展上的数字阅读馆吸睛小读者
“直击”AI新世界,智能机器人再次“火出圈”了
AI行业盛会大咖云集!Sam Altam、“AI教父”......一文看懂最新观点
洞穴探险神器?可自主导航的单旋翼自旋无人机,效率更高!
猿编程参加人工智能高峰论坛,推动人工智能教育解决方案在千所学校推行
猿辅导推出Motiff,整合三大AI功能,助力UI设计生产力革新
ChatGPT只讲这25个笑话!实验上千次有90%重复,网友:幽默是人类最后的尊严
郭帆:AI发展日新月异,或是弯道超车好莱坞的最好机会
数字彩排、虚拟建厂!这家顶级洗衣机工厂敲开“工业元宇宙”之门
视觉中国推出AI灵感绘图功能
海南省公安机关警用无人机培训班结业并举行警航比武演练
两架海燕号无人机交付中国气象局 助力建设国家级机动气象观测业务
第二届光合组织AI解决方案大赛赛果揭晓
特斯拉 Optimus 人形机器人入驻北美门店,帮助提升汽车销量
拓普龙7188ML:轻便壁挂式工控机箱,为人工智能应用场景提供有力保障
2025世界人工智能大会(上海)开幕式纪要
生成式人工智能来了,如何保护未成年人? | 社会科学报
“聚智启新,‘蓉’力同行” 成都市人工智能产业融通对接会成功举办
微软和谷歌面临的人工智能困境:需要投入大量资金才能获得盈利
宇宙探索下一阶段,机器代替人类,AI会在太空探索中取代人类吗?
周星驰支持的人工智能与 Web3 初创公司 Moonbox 完成 100 万美元融资
“思享荟”沙龙热议AIGC与元宇宙 复旦大学赵星畅谈深度数字化
无人机在电力巡检中的应用:全面解析高效巡检流程
马克龙密会AI专家,法国加入全球人工智能竞赛
商业智能决策技术助力降本增效,世界人工智能大会举办商业AI高峰论坛
零AI含量!纯随机数学无限生成逼真3D世界火了,普林斯顿华人一作
日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病
Meta发布"类人"AI图像创建模型,能解决多出手指等Bug
360°/180°双模式,佳能公布可折叠小体积的VR全景相机
Yann LeCun团队新研究成果:对自监督学习逆向工程,原来聚类是这样实现的