发布时间:2023-08-19
点击次数: 魔搭社区推出了一款名为live portrait的ai视频生成工具,能够通过一键操作使照片中的人物开口说话
阿里云推出了一项名为Live Portrait的数字人视频生成工具,用户只需上传一张照片和一段文本或语音,即可生成一段开口说话的数字人视频。这项工具可应用于视频|直播|、聊天机器人、企业营销等多个场景。目前,该工具已在魔搭社区创空间开放体验
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

随着自对话大模型和AI绘画模型的风靡,研究界正逐渐将生成式AI的研究推向更多模态的方向,其中AI视频生成技术备受关注。该技术能够将文本或音频等信息转化为面部运动信息,从而生成具有人物形象的动画照片,有效降低了视频拍摄和制作的门槛
阿里云最新上线的Live Portait工具,结合了运动模块和生成模块。该工具采用了阿里云自研的口型预测算法,大幅提高了口型生成的准确度,相较于传统方法有显著提升。在训练阶段,增加了姿态的显式控制,使得生成的视频可以呈现任意动作,无需底板视频,从而大幅提升了数字人说话的真实感。此外,通过眼神主动控制技术,Live Portait可以为眼球增加自然运动,使得生成结果更加接近真人效果。据介绍,Live Portait相关技术已被国际AI顶会CVPR、ICCV等收录

ChatGPT Writer
免费 Chrome 扩展程序,使用 ChatGPT AI 生成电子邮件和消息。
106
查看详情
根据魔搭社区的信息,Live Portait提供了两种方式供用户选择上传照片后,即文本驱动和音频驱动。在文本驱动模式下,用户可以选择28种不同的声音,包括普通话、英语、粤语和童声等。此外,Live Portait还提供了轻量模型选择,以帮助用户更快地生成视频
张邦,该工具算法负责人,表示:“Live Portait整合了团队多项自主研发的创新技术,包括利用单张图片即可生成逼真的面部动画,突破了传统对抗生成网络的限制。随着技术的不断演进,图像生成视频具有广阔的应用前景,有望成为企业提高生产效率、降低成本的重要工具。”
据了解,该团队的研究方向包括数字人、3D模型AI生成、高逼真渲染和自然人机交互等领域,已经在国际顶级会议上发表了50多篇论文
以上就是魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话的详细内容,更多请关注其它相关文章!
# 推出了
# 荔枝营销推广目标是什么
# 中文网
# 相关文章
# 据了解
# 只需
# 已被
# 两种
# 多个
# 粤语
# 一键
# 曲靖营销推广项目公司
# 镇巴网站建设
# 天津网站建设美丽图片
# 黄岛区网站优化工具
# 达人营销推广方案
# 江阴网站建设服务价格
# 甘肃新网站建设贵不贵
# 长沙精准营销推广
# 排名第一抖音关键词优化推广
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
彭博社:苹果Vision Pro曾测试VR手柄追踪方案
Adobe旗下Illustrator引入生成式AI工具Firefly
世界人工智能大会中西部县域数字就业中心组团亮相
iPhone两秒出图,目前已知的最快移动端Stable Diffusion模型来了
阿里达摩院发布免费开放100项AI专利许可的动机是什么?
OpenAI更新GPT-4等模型,新增API函数调用,价格最高降75%
基于信息论的校准技术,CML让多模态机器学习更可靠
能走、能飞、能游泳,科学家打造全能 M4 机器人
联想浏览器引入小乐 AI 助手,成功接入百度文心一言大模型,经过实测证实
速途网络成立“人工智能专家委员会”5位中美博士加盟
微幼科技晨检机器人:幼儿园健康保障的新伙伴
AI和ML推动联网设备的增长
IBM将模拟计算用于人工智能,重塑AI计算
中兴通讯无人机高空基站助力北京门头沟受灾乡镇保障应急通信
硅谷人工智能研究院创始人皮埃罗·斯加鲁菲:Transformer模型演讲
中国联通发布图文AI大模型,可实现以文生图、视频剪辑
首部国内AI辅助动画片《魔游纪:人工智能辅助篇》预告发布
人工智能在重症监护室的未来
人工智能在服务优化方面优缺点有哪些
彬州市第三届青少年机器人创新大赛成功举办
V社悄悄封禁使用AI生成美术素材的游戏
马斯克的幽默“现实”:AR眼镜与20美元“增强现实”哪个真实?
WAIC 2025|云深处科技绝影Lite3与X20四足机器人亮相
泗洪:畅通城市“血管” ,管下机器人来帮忙
站在社会的高度理解人工智能
昇思开源社区理事会成立,基于昇思AI框架的全模态大模型“紫东.太初2.0”发布
RoboNeo安装教程
阿里云连续两年进入Gartner云AI开发者“挑战者象限”
"探索Meta发布的Quest MR/VR视频录制与拍摄指南"
探索人工智能和物联网的动态融合
掌阅科技申请阅爱聊商标 掌阅科技申请AI相关商标
“踩油门,也要会踩刹车” 互联网企业高管谈人工智能发展
清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳
7条线路感受智慧美好生活,“2025 世界人工智能大会民营企业社会开放日”主题活动启动
生成式AI爆发,亚马逊云科技持续专注创新,助力企业数字化转型
BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」
喜马拉雅在国际会议挑战赛中突破语音重叠难题斩获第一 加速AI创新
苹果公司迅速拓展AR/VR团队,Vision Pro发布后7月份增设近100份工作机会
如何对员工进行再培训以充分利用供应链管理中的人工智能创新
微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课
微软向美国政府提供GPT大模型,如何保证安全性?
无人机自主巡检为高海拔输电线路运维添“新彩”
数据科学,解码智能未来——Altair首次提出“Frictionless AI”概念
“上海市民营企业人工智能赋能创新中心”揭牌成立
研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
传Meta 2025年推出首款AR眼镜,采用军用级别材料,计划生产1000台
新华三集团总裁兼首席执行官于英涛:人工智能时代需要想象力,更需要精耕务实
OpenAI 已全面开放 GPT-3.5 Turbo、DALL-E 及 Whisper API
一次购买全年省心,入手科沃斯这几台机器人,省下时间就是金钱
吴恩达、Hinton最新对话!AI不是随机鹦鹉,共识胜过一切,LeCun双手赞成