发布时间:2025-12-17
点击次数: 腾讯混元世界模型1.5(tencent hy worldplay)现
已正式上线,官方公告内容如下:
它上手极简: 仅需一段文字描述或一张图片,即可快速生成个性化的可交互虚拟世界。 它支持沉浸式实时操控: 键盘、鼠标或游戏手柄均可作为输入设备,实时调整虚拟相机的位置与朝向,带来如游玩3A大作般的自由探索体验。 它开箱即用: 访问腾讯混元3D官网即可申请试用(https://www.php.cn/link/fc841e513da905da7664e80c91f54339)。 它全面开源: 混元世界模型1.5(WorldPlay)首次对外公开了业内最完整、最系统的实时世界模型技术栈,覆盖数据构建、模型训练、流式推理与部署等全生命周期环节,并创新性地引入“记忆重构机制”、“长上下文蒸馏策略”以及“面向3D空间的自回归扩散模型强化学习框架”等核心算法模块。

混元世界模型1.5具备以下三大关键能力:
在技术实现层面,混元世界模型1.5首次开源了业界最完备的实时世界模型训练体系,贯穿数据采集、模型预训练、持续优化、推理部署全流程。技术报告中详细披露了预训练策略、增量训练范式、自回归视频模型的强化学习微调、带记忆能力的模型蒸馏等关键技术路径,并深入阐述了其在控制空间建模(control space)、记忆重构(reconstituted memory)、上下文强制蒸馏(context forcing)及强化学习后训练四大核心模块的设计理念与原创方案。

混元世界模型1.5的核心架构为名为WorldPlay的自回归扩散模型,采用Next-Frames-Prediction视觉自回归任务进行端到端训练,成功实现了兼具实时响应与长程几何一致性的交互式世界建模,突破了行业长期面临的“实时性”与“空间一致性”难以兼得的技术瓶颈。
Magic AI Avatars
神奇的AI头像,获得200多个由AI制作的自定义头像。
47
查看详情
该模型融合三项关键技术突破:双通路动作表征实现毫秒级精准控制、上下文记忆重构机制保障长时间尺度下的三维结构稳定性、上下文对齐蒸馏技术显著提升长视频生成的视觉质量与几何精度。此外,项目还构建了一套基于3D感知奖励函数的强化学习后训练框架,进一步优化生成结果的空间合理性与观感表现力。
在数据支撑方面,混元团队自主研发了全自动3D场景渲染流水线,可高效产出海量高保真真实世界渲染样本,为模型核心能力提供坚实基础。混元世界模型1.5目前已实现24帧/秒的长时流式生成能力,其一致性表现与跨场景泛化能力均达到实用级水准。
在线体验入口:https://www.php.cn/link/fc841e513da905da7664e80c91f54339
GitHub 仓库:https://www.php.cn/link/c16a2e5d3f5c70f954488189c3b3fa44
Hugging Face 模型页:https://www.php.cn/link/bf3db48ad49a6cbe21fa3ec8b97c8b83
项目主页:https://www.php.cn/link/a1e7fb77550451d64aed45250cdcb04b
源码下载地址:点击下载
以上就是腾讯混元世界模型1.5发布,首次开源业界最系统、最全面的实时世界模型框架的详细内容,更多请关注其它相关文章!
# github
# 腾讯
# 栈
# red
# git
# 淮南网站推广技术
# 那曲天猫seo
# 拉卡拉营销推广系统代理
# 锦州网站建设加盟公司电话
# 广州seo讨论群
# 主题网站建设平台
# 超级营销推广上新
# seo外包-推荐u
# 重庆市网站推广费用多少
# 福田区网站建设推荐
# 多个
# 鼠标
# 成长之路
# 长程
# 流式
# 最全面
# 重构
# 开源
# 首次
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级
郭帆:AI发展日新月异,或是弯道超车好莱坞的最好机会
QQ音乐业内率先推出「AI一起听」功能,领取你的AI听歌助手
北京公司实施AI技术,推行4.5天工作制,抵制996文化,提升员工工作幸福感
一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了
MiracleVision视觉大模型上线时间
李开复:未来几年,人工智能会革了所有人的命,除非你这么做
OpenAI高管:AI能创造新的就业机会 但也会淘汰一些
张勇对话多位诺奖得主 人工智能将无处不在
美图设计室2.0使用教程
郭帆谈ChatGPT:电影行业需要创新,否则人工智能将让电影变得平庸
OpenAI大神Karpathy最新分享:为什么OpenAI内部对AI Agents最感兴趣
水路两栖艇、消防灭火机器人……这个展览“黑科技”抢眼
Meta开源文本生成音乐大模型,我们用《七里香》歌词试了下
了解 AGI:智能的未来?
腾讯自主研发机器狗 Max 升级,可“奔跑跳跃”完成避障动作
抛媚眼给瞎子看?微软、谷歌的AI广告被广告主抵制
先进技术在防止全球数据丢失方面的作用
数字彩排、虚拟建厂!这家顶级洗衣机工厂敲开“工业元宇宙”之门
人工智能在重症监护室的未来
深企派遣无人机救援队赴京津冀开展防汛救灾任务
人工智能自己玩自己
「电子果蝇」惊动马斯克!背后是13万神经元全脑图谱,可在电脑上运行
Meta发布语音AI模型 Voicebox 助虚拟助手与NPC对话
V社谈AI制作游戏被ban:为确保开发者有素材所有权
特斯拉首发人形机器人“擎天柱”亮相世界人工智能大会
生成式AI爆发,亚马逊云科技持续专注创新,助力企业数字化转型
微软 Azure AI 文本转语音服务升级:新增男性声音和扩展语言支持
马斯克发推讽刺人工智能:机器学习的本质就是统计
亚马逊确认今年不举办re:MARS人工智能大会
马斯克称未来机器人数量将多于人类,特斯拉愿共享自动驾驶技术
OpenAI更新GPT-4等模型,新增API函数调用,价格最高降75%
《上古卷轴5》AI高清材质包优化游戏中所有怪物
尼康尼克尔 Z 180-600mm f/5.6-6.3 VR 镜头发布,12499 元
阿里云连续两年进入Gartner云AI开发者“挑战者象限”
1分钟做出苹果Vision Pro「官网」?上班8小时搞出480个网页,同事被卷疯了
AI和ML推动联网设备的增长
干货满满,2025昆山元宇宙国际装备展等你来打卡!
Databricks 发布大数据分析平台 Spark 用 AI 模型 SDK:一键生成 SQL 及 FySpark 语言图表代码
马斯克预测:特斯拉全自动驾驶将在今年实现 对AI深度变化感到担忧
首届全国体育人工智能大会在首都体育学院召开
OpenAI 静默关闭 AI 文本检测工具,准确率仅为 26%
吉林首例!机器人辅助下搭桥手术成功实施
高质量数据推动AI场景化应用快速发展及落地
苹果推出全新沉浸式 AR 体验应用“Deep Field”
重塑未来生活的五项技术趋势
移远通信率先完成多场5G NTN技术外场验证,为卫星物联网应用落地提速
360发布数字安全和人工智能的强大结合:360安全大模型
OpenAI已向中国申请注册“GPT-5”商标,此前已在美国提交申请
提高开发效率:AmazonCodeWhisperer与Amazon Glue的集成和生成式AI的应用