400 128 6709

行业新闻

如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念

发布时间:2024-03-14点击次数:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如何把大量物理知识塞给ai?eit和北大团队提出「规则重要性」概念

编辑 | ScienceAI

深度学习模型由于其可以从海量数据中学习潜在关系的能力而在科学研究领域产生了深远影响。然而,纯粹依赖数据的模型逐渐显露出其局限性,包括对数据的过度依赖、泛化能力的限制以及与现实物理世界的一致性问题。这些问题推动着研究者探索更具解释性和可解释性的模型,以弥补数据驱动模型的不足。因此,结合领域知识和数据驱动方法,构建更具可解释性和泛化能力的模型成为当前科学研究的重要方向。这种

例如,美国OpenAI公司开发的文本到视频模型Sora因其出色的图像生成能力而备受赞誉,被认为是人工智能领域的重要进展。尽管能够生成逼真的图像和视频,Sora在处理物理定律方面仍存在一些挑战,比如重力和物体碎裂等。虽然Sora在模拟现实场景方面取得了显著进展,但在理解和准确模拟物理规律方面还有改进的空间。AI技术的发展仍需要不断努力,以提高模型的全面性和准确性,从而更好地适应各种现实世界的情境。

解决这一问题的一个潜在途径是将人类知识融入深度学习模型中。通过结合先验知识和数据,可以增强模型的泛化能力,从而产生能够理解物理规律的「知情机器学习」(Informed machine learning)模型。这种方法有望提高模型的性能和准确性,使其能够更好地应对现实世界中的复杂问题。通过将人类专家的经验和洞察力融入机器学习算法,我们可以建立更加智能和高效的系统,从而推动人工智能技术的发展和应用。

目前,对深度学习中知识的确切价值仍然缺乏深入探讨。在确定哪些先验知识可以有效地整合到模型中以进行“预学习”方面,存在着一个急需解决的难题。同时,盲目地融合多项规则可能导致模型的失效,这一点也是需要引起重视的。这些限制给数据与知识关系的深入探索带来了挑战。

针对这一问题,东方理工(EIT)和北京大学的研究团队提出了「规则重要性」的概念,并开发了一套框架,能精确计算每个规则对模型预测精度的贡献。该框架不仅揭示了数据和知识之间的复杂相互作用关系,为知识嵌入提供了理论性指导,还有助于在训练过程中平衡知识和数据的影响。此外,该方法还可用于识别不恰当的先验规则,为交叉学科领域的研究与应用提供广阔前景。

这项研究题为“Prior Knowledge's Impact on Deep Learning”,已于2025年3月8日在 Cell 出版社旗下的跨学科期刊《Nexus》上发表。该研究受到了 AAAS(美国科学促进会)和 EurekAlert! 的关注报道。

如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念

在教授孩子拼图时,既可以让他们通过反复试验来找出答案,也可以用一些基本的规则和技巧来引导他们。同样地,将规则和技巧——比如物理定律——融入到人工智能训练中能让它们更贴近现实,运作更高效。然而,如何评估这些规则在人工智能中的价值,一直是困扰研究者的难题。

鉴于先验知识的丰富多样性,将先验知识融入深度学习模型是一个复杂的多目标优化任务。研究团队创新性地提出了一个框架,以量化不同先验知识在提高深度学习模型方面的作用。他们将此过程视为充满合作与竞争的博弈,通过评估规则对模型预测的边际贡献来界定其重要性。首先生成所有可能的规则组合(即「联盟」),并对每个组合构建模型,并计算均方误差。

为降低计算成本,他们采用了一种基于扰动的高效算法:先训练一个完全基于数据的神经网络作为基线模型,然后逐一加入各个规则组合进行额外训练,最后在测试数据上评估模型表现。通过比较模型在包含和不包含某个规则的所有联盟中的表现,可以计算出该规则的边际贡献,进而得出其重要性。

如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念

图示:规则重要性的计算流程(来源:论文)

通过流体力学的算例,研究人员探讨了数据与规则间的复杂关系。他们发现,在不同任务中,数据和先验规则的作用完全不同。当测试数据与训练数据分布相近时(即 In-distribution),数据量的增加会削弱规则的作用。

然而,当测试数据与训练数据分布相似度较低时(即 Out-of-distribution),全局规则的重要性被凸显出来,而局部规则的影响则被削弱。这两类规则的区别在于:全局规则(如控制方程)影响整个域,而局部规则(如边界条件)仅作用于特定区域。

Machine Translation Machine Translation

聚合多个来源的AI翻译

Machine Translation 49 查看详情 Machine Translation

如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念

图示:规则重要性与数据量之间的关系(来源:论文)

研究团队经数值实验发现,在知识嵌入中,规则间存在三种相互作用效应:依赖效应、协同效应和替代效应。

依赖效应指某些规则需依赖其他规则才能有效;协同效应表明多条规则共同作用的效果超越各自独立作用时的总和;替代效应则显示一条规则的功能可能被数据或其他规则替代。

这三种效应同时存在,并受到数据量的影响。通过计算规则重要性,可清晰展示这些效应,为知识嵌入提供重要指导。

在应用层面,研究团队试图解决知识嵌入过程中的一个核心问题:如何平衡数据与规则的作用,以提升嵌入效率并筛选出不适宜的先验知识。在模型的训练过程中,该团队提出了一种动态调整规则权重的策略。

具体而言,随着训练迭代步的增加,逐渐增大正重要性规则的权重,同时减小负重要性规则的权重。这种策略能够根据优化过程的需求,实时调整模型对不同规则的关注度,从而实现更加高效和准确的知识嵌入。

此外,向 AI 模型传授物理定律可以使它们「更加贴近现实世界,从而在科学和工程领域发挥更大作用」。因此,该框架在工程、物理和化学领域具有广泛的实际应用。研究人员不仅优化了机器学习模型来求解多元方程,还准确识别出对薄层色谱分析预测模型性能有提升效果的规则。

实验结果显示,通过融入这些有效规则,模型的性能得到了显著提升,测试数据集上的均方误差从 0.052 降低至 0.036(减少了 30.8%)。这意味着该框架可以将经验性见解转化为结构化知识,从而显著提升模型性能。

总体而言,准确评估知识的价值有助于构建更契合现实的AI模型,提高安全性和可靠性,对深度学习发展具有重要意义。

如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念

图示:通过规则重要性以识别有效的规则(来源:论文)

接下来,研究团队计划将他们的框架开发成可供人工智能开发人员使用的插件工具。他们的最终目标是开发出能够直接从数据中提取知识和规则,进而自我完善的模型,从而打造一个从知识发现到知识嵌入的闭环系统,使模型成为真正的人工智能科学家。

论文链接:https://www.cell.com/nexus/fulltext/S2950-1601(24)00001-9

AAAS 报道链接:https://www.eurekalert.org/news-releases/1036117

以上就是如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念的详细内容,更多请关注其它相关文章!


# 相互作用  # 锦州seo营销加盟公司  # 百捷seo介绍  # 孝感网站推广代运营  # 福建推广网站建设  # 泰顺seo优化运营  # 建设网站视频视频  # 百度关键词排名首  # 铁岭抖音seo打造公司  # 西安IT培训seo  # 安阳搜狗网站推广  # 理论  # 而在  # 腾讯  # 过程中  # 这一  # 他们的  # 测试数据  # 中国科学院  # 提出了  # 北大  # sora 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 走进首家“元宇宙”未来工厂,卡奥斯探知工业之旅出发!  陈丹琦ACL学术报告来了!详解大模型「*」数据库7大方向3大挑战,3小时干货满满  业内领先 四川大学华西第四医院甲状腺乳腺外科成功进入手术机器人时代  LinkedIn 推出生成式 AI 辅助撰写帖文功能,将向所有用户开放  消息称苹果 iPhone 15 系列健康应用将深度融合 AI 技术  用AI技术点亮老照片:Deep Nostalgia带给照片新生动感  华为推出全新操作系统HarmonyOS 4,AI和新引擎完美融合  人手一部「*」!视频版Midjourney免费可用,一句话秒生酷炫大片惊呆网友  人工智能行业急缺人 AI人才年薪能达近42万元  第四范式“式说”大模型入选《2025年通用人工智能创新应用案例集》  利用AI技术更好地发展农村电商  抢占新赛道 加快机器人产业集聚发展  将上下文长度扩展到256k,无限上下文版本的LongLLaMA来了?  AI拉动PCB发展|行业发现  人工智能快速发展 打开就业新空间  优化系统韧性:故障恢复与监控在RabbitMQ中的应用  探展WAIC | 第四范式“式说”聚焦toB大模型,布局生成式AI重构企业软件  微软更新服务协议,以防止通过AI服务进行逆向工程和数据抓取  全场景智能车:智能无处不在|芯驰亮相世界人工智能大会  到中国科技馆体验“一滴油的奇妙旅行”,线上元宇宙展厅同步开启  自动驾驶汽车避障、路径规划和控制技术详解  看似低调,实则稳健:字节在AI路上会遇到什么?  iPhone两秒出图,目前已知的最快移动端Stable Diffusion模型来了  Databricks 发布大数据分析平台 Spark 用 AI 模型 SDK:一键生成 SQL 及 FySpark 语言图表代码  猿编程参加人工智能高峰论坛,推动人工智能教育解决方案在千所学校推行  智能客服进入AI 2.0时代 容联云发布语言大模型“赤兔”  靠游戏更靠AI 英伟达成唯一首季度两位数增长的公司  人工智能产业竞跑“未来赛道” 创新发展放大“赋能”效应  「电子果蝇」惊动马斯克!背后是13万神经元全脑图谱,可在电脑上运行  行业首发「超级智绘」AI故事集,TCL实业推进AI技术应用  五个IntelliJ IDEA插件,高效编写代码  小岛秀夫不反对使用AI 但认为人类应该凌驾于AI  曝光HarmonyOS 4的重要新能力:全面升级AI大模型,小艺实现全面进化  AI遇上大运丨热身拉伸、娱乐K歌……AI智能健身镜将亮相成都大运会  全媒封面丨⑤商汤科技:原创AI算法“发电厂”  OPPO三方联合发布AI可持续发展白皮书,坚持发展健康AI生态  构建AI绘画网站的方法:使用API接口和调用步骤  6月14日《星空下的对话》 张朝阳陆川将畅聊人生、电影、心理学与AI  击败LLaMA?史上超强「猎鹰」排行存疑,符尧7行代码亲测,LeCun转赞  百度创始人、董事长兼首席执行官李彦宏:AI原生应用比大模型数量更重要  微软向美国政府提供GPT大模型,如何保证安全性?  如何用户外电源给无人机实现持久续航  多家欧洲企业签署公开信,批评欧盟 AI 法案草案限制产业发展  AI室内设计软件流行,室内设计行业如何应对效率变革  深企派遣无人机救援队赴京津冀开展防汛救灾任务  无人机巡检方案是什么,该如何选择适合的巡检方案  “五年内人类程序员将消失”预言引争议,AI真的那么强大了吗?  ChatGPT会成为你家新的语音助手吗?  2025世界人工智能大会(上海)开幕式纪要  WHEE安装教程 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司