发布时间:2025-09-19
点击次数: 图像模型开源领域迎来新突破!Black Forest Labs正式宣布开源其旗舰级图像编辑模型FLUX.1 Kontext[dev]。这款模型虽仅有12B参数,却展现出与GPT-image-1等闭源大模型相媲美的强大能力,并且支持在消费级显卡上流畅运行。
借助FLUX.1 Kontext[dev],用户可轻松完成多种图像编辑任务。例如让小狗瞬间从画面中消失,为小老鼠“戴上”胡须,添加文字或更换背景也变得异常简单。更值得一提的是,该模型支持多轮指令输入,允许用户反复调整,直到生成满意的图像效果。
FLUX.1 Kontext[dev]具备多项突出特性:
它能根据文本指令直接对现有图像进行修改,实现精准的局部和全局编辑。无需微调即可复用角色、风格和物体元素。支持连续多次编辑操作,在保证视觉一致性的同时显著降低视觉漂移问题。此外,模型还针对NVIDIA Blackwell架构进行了TensorRT权重优化,进一步提升性能表现。
网友们对该模型表现出极大热情,纷纷动手实测。有人创作出戴着墨镜、身穿红毛衣的旅行CPU青蛙;有人复制心仪动漫人物形象;更有创意达人将其与LoRA结合,开发出一款Kontext风格化肖像生成APP。目前,FLUX.1 Kontext[dev]已全面兼容ComfyUI,官方还开放了试玩API接口,点击文末链接上传图片即可立即体验。
不少网友评价Black Forest Labs堪称“图像界的DeepSeek”。此前发布的FLUX.1 Kontext系列因出色的上下文理解与图像编辑能力广受赞誉。不同于传统文生图模型,FLUX.1 Kontext支持上下文感知的图像生成,能够同时接受图像和文本作为提示输入,无缝提取并修改图像细节。目前已推出专业版FLUX.1 Kontext[pro]和高配版FLUX.1 Kontext[max]。
此次开源的FLUX.1 Kontext[dev]继承了该系列的核心优势,专注于图像编辑功能,并可在普通消费级硬件上高效运行。模型架构基于FLUX.1——一种在图像自动编码器潜在空间中训练的整流流Transformer结构,采用双流与单流模块混合设计。在此基础上,通过优化标记序列构建和位置信息编码增强性能。
其中,标记序列构建是将图像经由冻结的FLUX自动编码器编码为潜在上下文图像标记,并送入模型的视觉流;位置编码则利用三维旋转位置嵌入(3D RoPE),为上下文标记引入恒定偏移量,视作虚拟时间步,有效分离上下文块与目标块,同时保留其内部空间结构。
训练过程中,采用整流流匹配损失函数,从FLUX.1文生图检查点出发,收集并整理数百万组关系对用于优化。随后使用潜在对抗扩散蒸馏(LADD)技术对优化后的流匹配模型进行压缩,在减少采样步数的同时提升生成质量,使模型更加高效。最终版本的FLUX.1 Kontext[dev]包含120亿参数,专精于编辑任务,支持迭代式编辑,能在复杂场景中稳定保留角色特征,实现精细的局部或整体修改。
为了评估模型性能,团队推出了自研评测基准KontextBench,涵盖1026个图像-提示对,涉及局部编辑、全局编辑、角色参考、风格参考和文本编辑五大类别。实验结果显示,FLUX.1 Kontext[dev]在多个指标上超越现有开源及闭源模型,包括字节跳动的Bagel、HiDream-E1-Full以及OpenAI的GPT-image-1等。
值得一提的是,FLUX.1 Kontext[dev]特别针对NVIDIA Blackwell架构完成了TensorRT权重优化
,不仅大幅提升推理速度,还显著降低内存占用。官方提供了BF16、FP8和FP4三种TensorRT权重变体,用户可根据需求灵活权衡速度、效率与画质,充分发挥新一代GPU硬件潜力。
实际测试反馈显示,该模型推理速度相较前代提升了4到5倍,在NVIDIA H100 GPU上平均5秒内即可完成一次生成,在Replicate平台上的单次调用成本约为0.0067美元,相当于每1美元可运行约149次。不过也有用户指出,在MacBook Pro搭载的M系列芯片上运行时,每次迭代耗时较长,大约需要1分钟。
欢迎各位亲自尝试这一强大工具,并在评论区分享你的使用体验!
试玩链接:https://huggingface.co/spaces/black-forest-labs/FLUX.1-Kontext-Dev
论文链接:https://arxiv.org/abs/2506.15742
代码链接:https://github.com/black-forest-labs/flux/blob/main/docs/image-editing.md
以上就是120亿参数图像模型FLUX.1 Kontext[dev]开源,性能对标GPT - image - 1的详细内容,更多请关注其它相关文章!
# github
# 编码
# 显卡
# app
# git
# 一键
# 辽源seo排名案例分析
# 专业版
# 安装包
# 迭代
# seo获客系统哪家好
# 红姐网站推广怎么样啊知乎
# 食用菌营销推广策划案例
# 网站怎么推广海报文案呢
# 菜板营销推广方案
# 装饰网站建设推广
# 亚马逊站内seo教学
# 网站推广必备软件推荐
# 关键词排名提升乚宙3斯25m
# 试玩
# 双流
# 一提
# 前代
# 的是
# 开源
# gpt
# openai
# ai
# nvidia
# mac
# 工具
# macbook
# 字节
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
一图速览 | 十大脑机接口关键技术发布
当TS遇上AI,会发生什么?
AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲
13万个注释神经元,5300万个突触,普林斯顿大学等发布首个完整「成年果蝇」大脑连接组
飒智智能机器人核心技术与应用论坛暨一体化控制器发布会成功举办
数据科学,解码智能未来——Altair首次提出“Frictionless AI”概念
GPT-4不能在麻省理工学院获得计算机科学学位
2025年贵州省青少年机器人竞赛在安举行
人手一部「*」!视频版Midjourney免费可用,一句话秒生酷炫大片惊呆网友
AI室内设计软件流行,室内设计行业如何应对效率变革
13 个提高生产力的 AI 工具
全国青少年无人机大赛重庆市选拔赛开赛 1252名中小学生参加
科技数码圈的新物种 乐天派桌面机器人 AI +安卓+机器人 首发价1799元
上新7款产品,美图继续“蹭”AI
湖北科技职业学院举行工业机器人及智能制造技术专精特新产业学院建设启动仪式
传字节内测对话式 AI 产品,代号「Grace」;马斯克嘲讽苹果 头显;比亚迪 F 品牌定名「方程豹」
报告称 70% 程序员已使用各种 AI 工具编程
参议院司法听证会:AI 不易管控,有可能被恶意分子利用来研发生化武器
企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的
直击上影节 | 光线传媒董事长王长田谈新技术:未来VR放映效果可能媲美影院
加强能源消费绿色转型政策引导
IBM与NASA联手开源地理空间AI基础模型,促进气候科学领域进步
“五年内人类程序员将消失”预言引争议,AI真的那么强大了吗?
生成式AI爆发,亚马逊云科技持续专注创新,助力企业数字化转型
华为即将推出HarmonyOS 4,再度领先行业的AI技术
抛媚眼给瞎子看?微软、谷歌的AI广告被广告主抵制
腾讯企点客服接待与营销分析能力升级!企业操作更高效、人机交互更智能
人工智能助力精准学习,猿辅导小猿学练机满足学生个性化学习需求
从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级
AI绘画,还需要懂数学?
Bing 聊天机器人现支持在桌面端用语音提问
刊·见 | 捕捉人工智能领域最新动态?收藏Applied Artificial Intelligence
XREAL Beam 投屏盒子正式发布:支持“可悬停 AR 空间屏”
OpenAI已向中国申请注册“GPT-5”商标,此前已在美国提交申请
以分布式网络串联闲置GPU,这家创企称可将AI模型训练成本降低90%
重磅! 捷通华声灵云AICC荣获第二届光合组织AI解决方案大赛二等奖
2025世界人工智能大会(上海)开幕式纪要
人工智能写作检测工具不靠谱,美国宪法竟被认为是机器人写的
AI成政客博弈工具,美国大选真假难辨,律师们的生意来了
微软 Azure AI 文本转语音服务升级:新增男性声音和扩展语言支持
映宇宙集团执行总编辑:元宇宙还是要以人为媒介
500元一张的AI艺术二维码制作,详细教程来了!
看似低调,实则稳健:字节在AI路上会遇到什么?
如何成功实施人工智能?
美版贴吧8000小组自爆停摆!拒绝数据被谷歌OpenAI白嫖,CEO被网友骂翻:背刺第三方应用
人工智能加速走进百姓生活:从2025全球人工智能技术大会看行业新趋势
AYANEO AIR 1S 掌机发布:R7 7840U,预订价 4699 元起
上天下海登极,青岛与昇腾AI握手一起探索星辰大海
新闻传闻:迪士尼可能采用人工智能来控制电影制作成本
英伟达首席执行官黄仁勋:生成式 AI 时代「人类」会是新的编程语言